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Avilamvcin-Derivate 

Die Erfindung betrifft Avilamycin-Derivate, gentechnologische 
biosynthetische Verfahren zu deren Herstellung, Arzneimittel enthaltend 
diese Verbindungen, sowie die Verwendung dieser Verbindungen zur 
Herstellung eines Arzneimittels, bspw. gegen Infektionskrankheiten, wie 
auch Nukleinsauren, Proteine und Gencluster und entsprechende Zellen, 
die mit der Herstellung dieser Avilamycin-Derivate verbunden sind. 



Das Aufkommen pathogener, gegen Antibiotika multiresistenter Bakterien 
stellt eine wachsende Bedrdhung der menschlichen Gesundheit dar und 

25 hat die Suche nach neuen Wirkstoffen yerstarkt. Immer weniger neue 
Wirkstoffe sind in den letzten zwei Jahrzehnten bei zielspezifischen 
Wirkstoff-Screenings angefallen, so daB Forscher begonnen haben, 
neben der Suche nach neuen antibiotischen Wirkstoffen auch neue 
Technologien zur Herstellung neuer Verbindungen zu nutzen. Eine 

30 vielversprechende neue Technologie wird als kombinatorische 
Biosynthese bezeichnet und benutzt biosynthetische Gene als Mittel zur 
Herstellung neuer Wirkstoffe. 
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Eine unter anderem in diesem Kontext interessante Verbindungsklasse 
sind die Orthosomycine. Sie sind eine bekannte Klasse von Antibiotika, 
die von verschiedenen Actinomyceten hergestellt werden. Mitglieder 
5 dieser Klasse wirken auf eine breite Palette gram-positiver pathogener 
Bakterien, Inclusive glycopeptid-resistenter Enterococci, methicillin 
resistenter Staphylococcen and penicillin-resistenter Streptococcen. 

Prominente Beispiele an Orthosomycinen sind Avilamycin und 
Ip^l 10 Everninomicin, die von Streptomyces viridochromogenes Tu57 bzw. 

Micromonospora carbonacea hergestellt werden. Diese Antibiotika 
bestehen aus einer Heptasaccharid-Seitenkette und einer vom Polyketid 
abgeleiteten Dichloroisoevernin-Saure als Aglykon, wobei die Zucker- 
Reste zum Tell uber Orthoesterbindungen miteinander verknupft sind. 

15 Diese Bindung gibt der ganzen Klasse von Orthosomycinen den Namen. 
Der genaue Wirkmechanismus der Orthosomycine ist unbekannt. 
Wahrend fur fur ein bestimmtes Orthosomycin (Ziracin) ein 
Zellmembraneffekt diskutiert wurde (Walker, 1976; Langer, 1987) wird in 
neueren Publikationen eine Wechselwirkung mit dem ribosomalen Protein 

20 LI 6 angefUhrt (Foster und Rybak, 1999). FQr ein anderes Orthosomycin, 
Avilamycin A, wird eine Hemmung der Proteinbiosynthese angenommen 
und eine Inhibition des Translations-lnitiationskomplexes vorgeschlagen 
(Wolf, 1973). 

25 Das bekannte Avilamycin wurde 1959 aus Kulturfiltraten von 
Streptomyces viridochromogenes Tu57 isoliert (Buzzetti, et al., 1968; 
Mertz et al., 1986). Wie oben bereits angedeutet ist Avilamycin A, eine der 
Hauptkomponenten, aus Zuckern aufgebaut. Einzelkomponenten sind D- 
Olivose, 2-Desoxy-D-Evalose, 4-0-Methyl-D-fucose, 2,6-Di-O-Methyl-D- 

30 mannose und L-Lyxose. In Studien wies Avilamycin A ausgezeichnete 
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Aktivitat gegen multiresistente Staphylococcus aureus - Stamme auf 
(Zahner. 1999). Neben den Orthoestern soil der terminate 
Dichloroisoeveminsdure-Rest fur die Wirksamkeit essentiell sein (Wright, 
1979). Die DE 1116864 beschreibt wie die US 3,131.126 den Stoff 
Avilamycin inclusive eines allgemeinen Hinweises auf Derivate sowie 
Herstellung und Wirkung von Avilamycin. 



10 



15 



Ebenfalls zur Gruppe der Orthosomycine gehort Ziracin. Ziracin 
(SCH27899) ist ein Eveminomycin und wurde bereits klinisch getestet. 



H^C n/XHfi 



O OH HO OCH, , . , 

HjC--( ) H-c-CH, yy 

H-^— ("CH, 

o. o 




Wfi' ^ ^OH 

6^ ^ ^OH 



OH 



Avilamycin A 



H3C HiOOHX 



\ Vo O— w ^ °" 

— ( > N/' 



HiC 



Ziracin 



Sowohl beim Avilamycin als auch belm Ziracin hat sich in der Praxis 
20 allerdings gezeigt, da& der therapeutische Einsatz durch die zu geringe 
Hydrophilie beschrdnkt zu sein scheint. 



Gerade fUr die Klasse der Orthosomycine und Insbesondere fur das 
Avilamycin dOrfte molekulares Klonieren und Charakterisieren der die 
25 Biosynthese von Avilamycin A bestimmenden Enzyme von groBem 
Interesse sein, da diese Information die Richtung fQr die Entwicklung 
neuer antimikrobieller Antibiotika vorgeben kOnnte. Die Gene sind ein 
interessantes System, um die Bildung und VerknQpfung ungewdhnlicher 
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Desoxyzucker zu studieren und damit unter Umstanden fur eine 
kombinatorische Biosynthese von gro&em Wert. 

Vorherige Arbeit am biosynthetischen Gencluster von Avilamycin fuhrten 
5 zur Entschlusselung der Sequenz eines NDP-Glucose-Synthase-Gens 
(aviD [laufende Nr. 53 gemSB Tabelle 1]), eines NDP-Glucose-4,6- 
Dehydratase-Gens (aviE [laufende Nr. 54 gemaH Tabelle 1]) und eines 
Polyketid-Synthase-Gens (aviM (laufende Nr. 52 gemSB Tabelle 1]). Diese 
haben vermutlich eine Funktion als Tell einer iterativen Typ I Polyketid- 
10 Synthase zur Bildung von Orsellin-Saure, einem Zwischenprodukt in der 
Biosynthese von Dichloroisoeverninsaure. Die Expression von aviM in S. 
lividans fuhrte zur Bildung von Orsellinsaure [Gaisser, S., Trefzer, A., 
Stockert. S., Kirschning. A., & Bechthold, A. (1997), J Bacteriol. 179, 
6271-6278]. 
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Neben dem Auffinden und Identifizieren geeigneter Enzymsysteme und 
Synthesewege war es daher Aufgabe der Erfindung, neue Antibiotika zur 
VerfQgung zu stellen, insbesondere auch solche, die eine verbesserte 
Hydrophilie aufweisen. 



Uberraschenderweise stellte sich heraus, daB bestimmte Avilamycin- 
Derivate - insbesondere mit einem in entscheidenden Bereichen 
gegenuber dem Avilamycin veranderten Substitutionsmuster - diese 
Aufgabe losen konnen und sowohl antibiotische Wirkung als auch 
25 verbesserte Hydrophilie zeigen. Ein Gegenstand der Erfindung ist daher 
ein Avilamycin-Derivat gemdQ allgemeiner Formel I, auch in Form seiner 
Diastereomere oder Enantiomere bzw. razemischer oder anderer 
Gemische oder reiner Diastereomere und/oder Enantiomere, 
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Name of the 
compound 


Rl . 


R2 


R3 


R4 


Avilamycin A 


COCH3 


OCH3 


a 


a 


Avilamycin C 


CH{OH)CH3 


OCH3 


a 


a 


Oavibamycin Al 


COCH3 


OH 


CI 


CI 


Gavibamycin A3 


CH(OH)CH3 


OH 


CI 


a 


Gavibamycin Bl 


COCH3 


OH 


H 


H 


Gavibamycin B3 


CH(OH)CH3 


OH 


H 


H 



I 

, worin unabhSngig voneinander mit unten folgender Ausnahme 

Rl ausgewahit ist aus H. COCH3. COC4H9 Oder COCH(CH3)2, 
COCH2CH3 

R2 ausgewdhlt Ist aus H. CHO. COCH3 oder CH(OH)CH3. 

R3 OCH3 entspricht, 

R4 01 entspricht, . 

R5 01 entspricht. 

R6 CH3 entspricht, 

R7 H, CH3 Oder CH2OH entspricht. 



und 

R8 OCH3 entspricht. 

worin in bezug auf mindestens einen der Reste R2-R8 in Fomriel I 
abweichend von der voranstehenden Definition folgendes gilt: 

R3 ist durch OH zu ersetzen, 

R4 ist durch H zu ersetzen, 

R5 ist durch H zu ersetzen, 

R6 ist durch H zu ersetzen. 

und/oder 

R8 ist durch OH zu ersetzen, 



mit der Madgabe, da& R1-R8 nicht gleichzeitig die Bedeutungen 
gemaH der jeweiligen Kombination in einer der Verbindungen 1-6 
annehmen kdnnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


1 


COCH(CH3)2 


COCH3 


OH 


H 


CI 


CH3 


-CH3 


OCH3 


2 


COCH(CH3)2 


COCH3 


OCH3 


CI 


H 


CH3 


CH3 


OCH3 


3 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


H 


CH3 


OCH3 


4 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OH 



Dabei ist unter dem Ausdruck „rnit unten folgender Ausnahme" zu 
verstehen, daB es Ausnahmen von den diesem Ausdruck unmittelbar 
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folgenden generellen Definitionen der Reste R1-R8 gibt. die mit der 
Phrase „worin in bezug auf mindestens einen der Reste R2-R8 in Formel I 
abweichend von der voranstehenden Definition folgendes gilt" eingeleltet 
werden. 

Ggf. konnen die mit CI halogenierten Reste, Insbesondere R4 und/oder 
R5. auch durch andere Halogenide, bspw. F oder Br, halogeniert werden. 



Die erfindungsgemaBen Avilamycin-Derivate zeichnen sich insgesamt 
10 neben ihrer uberraschend starken antibiotischen Aktivitat insbesondere 
gegen Stapphylococcus aureus, insbesondere auch durch eine gegenuber 
den bekannten Orthosomycinen wie Avilamycin A oder C sowie 
Evernimycin deutlich verbesserten Hydrophilie aus. Gerade diese erhohte 
Hydrophilie macht diese Verbindungen aber zu attraktiven, insbesondere 
15 antibiotischen Wirkstoffen, da eine erhOhte Hydrophilie in bestimmten 
therapeutischen Anwendungen sehr envQnscht ist. AuBerdem gilt fQr 
dieses wie fur alle - auch folgend beschrlebenen - erfindungsgemaGen^ 
Avilamycin-Derivate, da& es eine Struktur aufweist, die sich einer 
klassischen organischen Synthese nur mit gro&er Mphe erschlie&t. Der 
20 hier zugrundeliegende Einsatz einer gentechnoiogischen Biosynthese zu 
Herstellung der erfindungsgema&en Avilamycin-Derivate erschlie&t damit 
veranderte. neue und bisher nicht zuganglich Wirkstoffe, insbesondere 
Antibiotika. 



25 Bevorzugt ist im Rahmen dieser Erfindung ein erfindungsgemaRes 
Avilamycin-Derivat, in dem mindestens R3 durch OH zu ersetzen ist, mit 
der Ma&gabe, da& R1-R8 nicht gleichzeitig die Bedeutungen gema& der 
Kombination In der Verbindung 1 annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


1 


COCH(CH3)2 


COCH3 


OH 


H 


CI 


CH3 


CH3 


OCH3 



Ebenfalls bevorzugt ist ein erfindungsgemSBes Avilamycin-Derivat, in dem 
mindestens R4 und R5 in Formel I durch H zu ersetzen sind. 

Besonders bevorzugt ist es weiter, diese Merkmale zu kombinieren, was 
zu einem erfindungsgemSBen Avilamycin-Derivat fQhrt. in dem mindestens 
R3 durch OH und R4 und R5 durch H zu ersetzen sind. 

Ein besonders bevorzugter Gegenstand der Erfindung, der die Aufgabe in 
besonders gOnstiger Weise Idst. ist dabel ein Avilamycin-Derivat gemdB 
allgemelner Fomiel I, das ausgewShlt ist aus Verbindungen, in denen R1- 
R8 jeweils die in folgender Tabelle angegebene Bedeutung haben, wie 
folgt kombiniert sind: 



R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH2CH3 


H 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH3 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH(CH3)2 


CH(OH)CH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


H 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH3 


CH(OH)CH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


H 


CH(OH)CH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COC4H9 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


CI 


H 


CH3 


CH3 


OCH3 


COCH2CH3 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


H 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


CH2OH 


OCH3 


COCH(CH3)2 


OHO 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


H 


OCH3 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OH 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH2CH3 


H 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH3 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH(CH3)2 


CH(OH)CH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


H 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH3 


CH(OH)CH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


H 


CH(OH)CH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 



COC4H9 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH2CH3 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


H 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH2OH 


OCH3 


COCH(CH3)2 


CHO 


OH 


H 


H 


CH3 


CH3 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


H 


OCH3 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH3 


OH 



Die Aufgabe wird auch durch Avilamycin-Derivate gelost. die durch ein 
besonderes Verfahren, das gentechnologische Manipulationen und 
Bioynthese beinhaltet herstellbar 1st. Ein weiterer Gegenstand der 
Erfindung ist daher ein Avilamycin-Derivat. das dadurch erhaltlich ist, da& 
in einer kultivierbaren Zelle, die die notigen Gene bzw. Enzyme zur 
Synthese eines Orthosomycin-GrundkOrpers bestehend aus 

(a) einem endstandigen DichloroisoeverninsSure-Rest (A in 
Fomriel I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 
in Formel I) aus: 

(i) zwei D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-P-Evalose-Rest (D), 

(iii) einem D-Fucose (E), 

(iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-)Eurekanat Rest (H) 



aufweist. mindestens eine Nukleinsaure. deren Sequenz zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaG einer der Sequenzen gemali 
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laufender Nummer 1 bis 54 (gem3& Tabelle 1 i.V.m. Abb. 1) und 
Abbildung 1 entspricht oder aber mit einer dieser Sequenzen unter 
maRig stringenten Bedingungen hybridisiert. gentechnologisch 
verandert, deletiert und/oder nicht exprimiert wird, die so 
modifizierte Zelle kultiviert wird, der Kulturuberstand gewonnen und 
aufgearbeitet wird, das oder die Avilamycin-Derivat/e aufgereinigt 
und isoliert wird und gegebenenfalls verschiedene Derivate 
getrennt werden, 



mit der Ma&gabe, daH R1-R8 nicht gleichzeitig die Bedeutungen 
gerndd der jeweiligen Kombination in einer der Verbindungen 1-16 
annehmen konnen: 



Nr. 


Ri 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


1 


CQCH(CH3)2 


COCH3 


OH 


H 


CI 


CH3 


CH3 


OCH3 


2 


COCH(CH3)2 


COCH3 


OCH3 


CI 


H 


CH3 


CH3 


OCH3 


3 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


H 


CH3 


OCH3 


4 


COCH(CH3)2 


CHO 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


5 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


H 


OCH3 


6 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OH 


7 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


8 


COCH2CH3 


H 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


9 


COCH3 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


10 


COCH(CH3)2 


CH(OH)CH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


11 


H 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


12 


COCH3 


CH(OH)CH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


13 


H 


CH(OH)CH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


14 


COC4H9 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 


15 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


CH2OH 


OCH3 


16 


COCH2CH3 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OCH3 



Dabei versteht man im Sinne der Erfindung darunter. daB . .die Zelie die 
notiqen Gene bzw. Enzyme zur Synthese eines Orthosomycin- 
Grundkoroers aufweist ". daB in der Zelle die fur die notwendigen Enzyme 
kodierenden Gene und/oder die funktionsfahigen Enzyme selbst 
vorhanden sind, die fur die Synthese eines „Orthosomycin-Grundk6rpers" 
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aus den Qblicherweise vorhandenen Vorstufen notig sind. Beispiele waren 
das erfindungsgemaBe Gencluster gemaft Abb. 109 Oder die „Open 
Reading Frames" (ORF) bzw. Gene gemaB laufender Nummer 1-54 
gema& Tabelle 1 i.V.m. Abb. 1 bzw. die zugehorigen Enzyme bzw. 
5 Proteine gemaB laufender Nummer 55-108 gemaB Tabelle 1 i.V.m. Abb. 
1. 



Die Definition des .Orthosomvcin-Grundkorpers" ist bereits angegeben, 
wbbei die Anordnung der Ortho- und der nomialeri Esterbindung der 
10 Formel I zu entnehmen ist. Einen solchen Grundkdrper weisen unter 
anderem Avilamycin und Evernimycin sowie erfindungsgema&e 
Avilamycin-Derivate auf (s. Formel I). 

Weiter versteht man im Sinne dieser Erfindung unter Gen einen Abschnitt 
15 der DNA, von dem ein einzelnes mRNA-Molekul (das dann in ein 
einzelnes Polypeptid Oder Protein translatiert wird) oder ein funktionelles 
RNA-MoIekQI (rRNA. tRNA) transkribiert wird. 

Im Sinne dieser Erfindung versteht man weiter unter . .Open Reading 
20 Frame" (ORF) einen DNA-Abschnitt. der mit einem Start-Codon beginnt. 
mit einem End-Codon endet und eine ununterbrochenen Folge von 
Codons for Aminosauren enthalt. Der Begriff . .Open Reading Frame" ORF 
wird hier zur Beschreibung eines klonierten und sequenzierten DNA- 
Abschnitts venA/endet, der einem Gen entspricht. 



25 



Unter Codon versteht man die kodierende genetische Grundeinheit. Sie 
besteht aus einem Triplett von drei konsekutiven Nukleotiden, die 
entweder fQr eine Aminosaure oder den Begihn oder das Ende einer 
Polypeptidkette. kodieren. 
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Weiter sind im Sinne dieser Erfindung unter kultivierbaren Zellen Zellen zu 
verstehen, die in-vitro in festem oder flussigem Medium ernahrt durch eine 
flussige oder verfestigte Nahrlosung, dem Kulturmedium. wachsen und 
sich vermehren. Im engeren Sinne sind dies insbesondere Zellen von 
5 Mikroorganismen oder leicht transfizierbare Zellen, in denen 
entsprechende Gene zur Expression gebracht werden konnen. Es kdnnen 
dies beispieisweise grampositive und gramnegative Bakterienzellen, wie 
z.B. Streptomyces-Zellen (z.B. Streptomyces viridochromogenes Tu 57), 
aber eben auch Systeme wie Saugetierzellen, z.B. CHO-Zellen (Chinese 
10 Hamster Ovary), oder immortalisierte Zellinien, z.B. HeLa- oder HEK- 
% Zellen, aber auch Insekten-, Fisch-, Amphibien-, Pilze- oder Hefezellen 

etc. sein. 

Unter einer Nukleinsaure versteht man im Sinne dieser Erfindung die, 
15 Grundeinheit von DNA und RNA und damit insbesondere auch die 
Grundeinheit eines Gens und eines ORF. Entsprechend kann eine 
Nukleinsaure ein Gen bzw. einen ORF umfassen und eine bestimmte 
NukleinsSuresequenz (die Abfolge der Basen auf dem Phosphat-Zucker- 
RQchrat einer Nukleinsaure) entsprechend ein Gen bzw. einen ORF 
20 definieren. Unter Nukleinsaure werden auch Sequenzen verstanden, die 
neben den codierenden Bereichen auch weitere Sequenzbereiche, 
Insbesondere am 5'- oder am 3'-Ende des codierenden Bereichs, 
enthalten. Diese Sequenzen konnen funktionslos sein oder aber 
Promoter- oder Enhancer-Signale, bevorzugt bakterielle bzw. dem zur 
25 Expression herangezogenen Wirtszellsystem entsprechende Signale, 
sein. Ganz besonders bevorzugt sind neben den fQr die 
erfindungsgema&en Proteine codierenden Sequenzbereichen solche 
Nukleotidsequenzen, die fQr sog. „Tags" codieren (bspw. His- oder Flag- 
Tag), so daB die in den Wirtszellen exprimierten erfindungsgema&en 
30 Proteine bspw. tiber Affinitatschromatographie ohne weiteres gereinigt 
werden konnen. An erfindungsgemaHe codierende Nukleotidsequenzen 



- 13- 



konnen damit beliebige Sequenzen vorzugsweise am 5' oder 3'-Ende 
angehangt werden. die fur AS-Sequenzen codieren. die einen Tag (bspw. 
ein Antigen) zur Bindung an einen Antikorper bspw. auf einer Saule 
enthalten. Mitoffenbart sind damit auch die AS-Sequenzen, die sich aus 
5 der Kombination von codierenden erfindungsgemd&en Nukleinsauren mit 
anderen Nukleotidsequenzen ergeben. 

Unter gentechnoloaisch ist im Sinne der Erfindung der Einsatz 
verschiedener Techniken zu verstehen, mit der DNA In eine Wirtszelle 
10 eingebracht wird bzw. DNA einer Zelle spezifisch verdndert wird. Darunter 
fallt z.B. der Einsatz von Klonierungstechniken, Vektoren, 
Restriktionsenzymen etc.. 



Entsprechend heiSt gentechnologisch verandert . daB ein Eingriff die 
15 Basenfolge, die Sequenz, der Nukleinsaure verandert hat, insbesondere 
die Basensequenz verkurzt (bis hin zur Deletion) oder Mutationen 
eingebaut wurden, meist mit der Folge, da& die Nukleinsaure (das Gen) 
nicht Oder nur noch verandert in eine mRNA transkribiert werden kann. 
Deletiert hei&t in diesem Falle, daH eine Nukleinsaure, die hier meist ein 
20 Gen Oder einen ORF umfa&t, ganz oder zumindest weitgehend aus der 
^ DNA entfernt wird, so dag die Nukleinsaure (das Gen) nicht oder nur noch 

verandert In eine mRNA transkribiert werden kann. Nicht exprimiert 
bedeutet entsprechend, daS die Nukleinsaure so verandert wurde, daB die 
Nukleinsaure (das' Gen) nicht oder nur noch verandert in eine mRNA 
25 transkribiert werden kann und entsprechend nicht mehr durch Translation 
das Polypeptid bzw. Protein entsteht. fur das die Nuleinsaure (das Gen 
Oder der ORF) ursprQnglich kodlert hat 



- 14- 



Unter maSiq stringenten Hvbridisierungsbedingungen werden je nach der 
verwendeten Nukleinsaure-Sequenz (Oligonukleotid. langeres Fragment 
Oder vollstandige Sequenz) bzw. je nachdem. welche Nukleinsaureart 
(DNA Oder RNA) fur die Hybridisierung verwendet werden, variierende 
5 Standardbedingungen verstanden. So liegen beispielsweise die 
Schmelztemperaturen fur DNArDNA-Hybride ca. 10 niedriger als die 
von DNAiRNA-Hybriden gleicher LSnge. Unter Standardbedingungen sind 
beispielsweise. je nach Nukleinsdure, Temperaturen zwischen 42 und 58 
""C in einer wSBrigen Pufferl6sung mit einer Konzentration zwischen 0,1 
10 bis 5 X SSC (1 X SSC = 0,15 IVI NaCI. 15 mM Natriumcitrat, pH 7.2) oder 
zusatzlich in Gegenwart von 50% Formamid, wie beispielsweise 42 "C in 5 
X SSC, 50% FomiannicI, zu verstehen. Vorteilhaftenweise liegen die 
Hybridisierungsbedingungen fur DNA:DNA-Hybride bei 0,1 x SSC und 
Temperaturen zwischen etwa 20 °C bis 45 °C, bevorzugt zwischen etwa, 
15 30 X bis 45 'C. FUr DNA:RNA-Hybride liegen die 
Hybridisierungsbedingungen vorteilhaft bei 0,1 x SSC und Temperaturen 
zwischen etwa 30 "C bis 55 "C, bevorzugt zwischen etwa 45 "C bis 55 "C. . 
Diese angegebenen Temperaturen fUr die Hybridisierung sind beispielhaft 
kalkulierte Schmelztemperaturwerte fUr eine Nukleinsdure mit einer Ldnge 
20 von ca. 100 Nukleotiden und einem G + C-Gehalt von 50 % in 
Abwesenheit von Fomnamid. Die experimentellen Bedingungen fOr die 
DNA-Hybridisierung sind in einschlSgigen Lehrbuchern der Genetik, wie 
beispielsweise bei Sambrook et al. ("Molecular Cloning", Cold Spring 
Harbor Laboratory, 1989), beschrieben und lassen sich nach dem 
25 Fachmann bekannten Formein, beispielsweise abhangig von der Lange 
der Nukleinsauren, der Art der Hybride oder dem G + C-Gehalt 
berechnen. Weitere Informationen zur Hybridisierung kann der Fachmann 
folgenden Lehrbuchern entnehmen: AusQbel et al. (eds), 1985, Current 
Protocols in Molecular Biology, John Wiley & Sons, New York; Hames and 
30 Higgins (eds), 1985, Nucleic Acids Hybridization: A Practical Approach, 
IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, Essential 
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Molecular Biology: A Practical Approach. IRL Press at Oxford University 
Press. Oxford. 

Unter Kultivierung 1st im SInne dieser Erfindung die in-vitro Zucht von 
5 kultivierbaren Zellen zu verstehen, wodurch diese in festem Oder 
flussigem Medium ernahrt durch eine flussige Oder verfestigte NdhrlOsung, 
dem Kulturmedium, wachsen und sich vermehren. 

Dabei versteht man unter Kulturuberstand das flussige Kulturmedium, das 
10 neben den Nahrstoffen fur die kultivierbaren Zellen auch die von diesen 
nach auBen ins Medium abgegebenen Metaboliten und Substanzen (z.B. 
Avilamycin-derivate) enthait. Dieser Kulturuberstand kann gewonnen und 
aufgearbeitet werden, wobei darunter insbesondere das Absaugen des 
Oberstandes und/oder eine Filtration zu verstehen ist. mit der die aus der 
15 Kultivierung und den Zellen Qbriggebliebenen Feststoffe abgetrennt 
werden. 

Der Kulturuberstand, der im Rahmen dieser Erfindung meist 
erfindungsgemaBe Avilamycin-Derivate enthait, kann nach der 

20 Aufarbeitung aufgereinigt werden, wobei darunter beispielsweise eine 
chromatographische Trennung und/oder Trennung uber Flussigphasen 
bzw. eine Kombination dieer Vorgehensweisen zu verstehen ist. Beispiele 
dafur sind eine Festphasen-Extraktion mit einem Methandl-in-Wasser- 
Gradienten Oder eine Ethyl-Acetat-Extraktion. Dabei wird die die 

25 Avilamycinderivate enthaltende Fraktion mOglichst weitgehend von 
anderen, andere Bestandteile des Kulturtiberstands enthaltenden 
Fraktionen getrennt und damit die Avilamycin-Derivate weitgehend isoliert , 
Als alternative Trenn- und/oder Reinigungsverfahren kommen jedoch auch 
di Methode des Aussalzens oder Um- oder Auskristallisierens in 

30 Betracht. Gegebenenfalls kann sich dann eine Isolierung und Trennung 
der einzelnen Derivate anschliessen, wobei hier insbesondere 
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Chrotographiemethoden eingesetzt werden. Ganz besonders bevorzugt 
sind dabei praparative HPLC-Methoden oder auch 
affinitatschromatographische Verfahren. 

Es ist bevorzugt. wenn beim Herstellungsverfahren, uber das das 
erfindungsgema&e Avilamycin-Derivat definiert wird, die kultivierbare Zelle 
ausgewahit ist aus einer Zelle vom Typ Streptomyces viridochromogenes 
Oder einer Zelle, die mit Ausnahme der gentechnologisch verdnderten, 
deletierten oder nicht exprimierten Nukleinsaure/n die Nukleinsauren 
gemaR laufnder Nr. 1-54 gemaB Tabelle 1 i.V.m. Abb. 1 bzw. dazu zu 
mindestens 95%, vorzugsweise 97 %, homologe NukleinsSuren enthalt 
Oder aber mit einer dieser Sequenzen unter maSig stringenten 
Bedingungen hybridisiert oder das Gencluster gemaB Abb. 109 enthalt. 
Unter dem zweiten Punkt der Auswahl sind insbesondere Zellen zu 
verstehen, in denen durch gentechnologische Methoden die fur die 
Avilamycin-Derivat-Synthese notwendigen Enzyme exprimiert werden, 
wobei eine der fur ein in den Streptomyces viridochromogenes TQ 57 
endogen vorkommenden Enzym kodierenden ^ Nukleinsauren 
gentechnologisch verandert oder deletiert ist bzw. nicht exprimiert wird, 
insbesondere die Nukleinsaure/DNA gar nicht erst gentechnologisch in die 
Wirtszelle eingebracht wird. Besonders bevorzugt ist es aber, wenn die 
Zelle ausgewahit ist aus einer Zelle vom Typ Streptomyces 
viridochromogenes, insbesondere einer Zelle vom Typ Streptomyces 
viridochromogenes Tu 57 bzw. A 23575. 

In jedem Falle ist es bevorzugt, wenn bei dem Verfahren die veranderte/n 
(z.B. deletierte/n bzw. nicht in die Wirtszelle eingebrachte/n) 
Nukleinsaure/n fur eine Methyltransferase und/oder fOr eine Halogenase 
kodierte/n. 



- 17- 

Alternativ kann die Herstellung auch auBerhalb eines in vivo Verfahrens 
als in vitro Synthese erfolgen. Hierbei werden die fur die Synthese 
erforderlichen Enzyme und/oder Enzymsysteme in mindestens einem 
Versuchsansatz vorgegeben, wobei vorzugsweise in mehreren 
s hintereinander geschalteten Versuchsansatzen die fur die Synthese 
erforderlichen Reaktionsschritte katalytisch von den erforderlichen und 
erfindungsgema&en Enzymen durchgefQhrt werden. Ggf. kOnnen 
zwischen die in entsprechend geeigneter Reihenfolge durchgefQhrten 
Einzelreaktionen Trenn- und/oder Reinigungsschritte zur Aufreinigung der 
^ 10 der jeweils envUnschten Zwischenprodukte eingefugt werden. 

Dabei versteht man unter Methvltransferasen Enzme, die eine 
Methylgruppe auf ein organisches Molekul ubertragen konnen. 
Insbesondere sind dies im Sinne der Erfindung Enzyme, die entwederauf 
15 die Orsellin-Saure Oder auf die Zucker, vorzugsweisde nach Bildung des 
Heptasaccharids, eine Methylgruppe Qbertragen, insbesondere die ORF's 
aviG2, aviG3, aviG5, aviG6, aviG1, aviG4, aviRa und aviRb, insbesondere* 
aviG4. 

Unter Halogenasen versteht man Enzyme, die enzymatisch Halogene auf 
20 organische MolekUle Ubertragen kOnnen. Insbesondere sind dies im Sinne 
der Erfindung Enzyme, die auf die Orsellin-Saure ein, vorzugsweise zwel 
Cl-Reste an den Positionen R3 und/oder R4 ubertragen, insbesondere der 
ORFaviH. 

25 Entsprechend ist es ein besonders bevorzugter Gegenstand der 
Erfindung, wenn in Bezug auf das oben genannte Herstellungsverfahren 
die Sequenz der veranderte/n Nukleinsaure/n vor der VerSnderung zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsduresequenz einer der Sequenzen gemad laufender Nr. 1, 2-7 
30 Oder 48-49 gemall Tabelle 1 i.V.m. Abb. 1 , vorzugsweise einer Sequenz 
gemaG laufender Nr. 1, 2-7 gemaH Tabelle 1 I.V.m. Abb. 1, insbesondere 
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einer der Sequenzen gemdH laufender Nr. 1 und/oder 2 gemaS Tabelle 1 
i.V.m. Abb. 1. entsprach oder aber mit einer dieser Sequenzen unter 
ma&ig stringenten Bedingungen hybridisierte. 

5 Dabei bedeutet „ vor der Veranderuna " im Sinne dieser Erfindung, daS die 
veranderte Nukleinsaure vor der gentechnologischen Manipulation an ihr, 
d.h. vor der Deletion oder der Verdnderung, insbesondere Verkurzung 
Oder Mutation in der Basensequenz, aber auch vor dem Schritt, diese 
Nukleinsaure/DNA gar nicht erst gentechnologisch in die Wirtszelle 
10 einzubringen, die genannte Nukleinsauresequenz aufweist. 

Weiter ist es bevorzugt, wenn in dem die Avilamycin-Derivate 
definierenden Herstellungsverfahren die Veranderung der Nukleinsaure/n 
dazu fuhrt, daB das oder die durch die gentechnolgisch veranderte/n 
15 Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
gentechnologischen Veranderung nicht mehr synthetisiert wird/werden. 

Dabei versteht man unter Polvpeptid ein Peptid mit zwischen 10 < und < 
100 Aminosaureresten und unter einem Protein ein MakromolekQI mit 
20 mehr als 100 uber Peptidbindungen verknupften Aminosaureresten. Dabei 
sind die Proteine im Zusammenhang mit dieser Erfindung vorzugsweise 
Enzyme. Es fallen aber natOrlich auch andere Proteine im Sinne dieser 
Erfindung unter diesen Begriff. 

25 Die bisher beschriebenen erfindungsgemaSen Avilamycin-Derivate haben 
ubenviegend bzw. alle gegenuber im Stand der Technik beschriebenen 
venvandten Orthosomycine, insbesondere gegenuber Avilamycin, den 
Vorteil, hydrophiler zu sein, was therapeutisch erhebliche Vorteile bietet. 
Das gilt insbesondere fOr einen Vergleich mit dem Avilamycin A oder C 

30 bzw. auch mit dem Everninomycin Ziracin. 
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Eine Aufgabe der Erfindung war es auch - neben der Bereitstellung neuer 
Antibiotika - die Biosynthese des Avilamycins au^uklaren, urn darauf 
basierend neue antimikrobielle Substanzen bzw. neue Verfahren zur 
deren Herstellung zu entwickeln. Ein Kernpunkt war dabei die molekulare 
5 Klonierung und die Charakterisierung der an der Avilamycin-Biosynthese 
beteiligten Gene. Es wurde ein ca. 60 kB groBes Stuck um die bekannten 
Gene aviD. aviE1 und aviM sequenziert. Dabei stellte sich heraus, dafi die 
beteiligten Gene in unniittelbarer Nahe voneinander in einem Cluster 
angeordnet waren. Die Sequenz der einzelnen ORF's sowie deren 

10 Anordnung auf deni zentralen Gencluster (laufenden Nr. Ibis 54) sind in 
Abb. 1 in Verbindung mit Tabelle 1, respektive Abb. 109, dargestellt. Wie 
bereits ausgefuhrt waren die Sequenz eines NDP-Glucose-Synthase- 
Gens (aviD [laufende Nr. 53 gemaB Tabelle 1 i.V.m. Abb. 1]), eines NDP- 
Glucose-4,6-Dehydratase-Gens (aviE [laufende Nr. 54 genriaS Tabelle 1 

15 i.V.m. Abb. 1]) und eines Polyketid-Synthase-Gens (aviM [laufende Nr. 52 
gemaS Tabelle 1 i.V.m. Abb. 1]) ebenso bekannt wie deren vermutliche 
Funktion als Teil einer iterativen Typ I Polyketid-Synthase zur Bildung von 
Orsellin-Sdure, einem Zwischenprodukt in der Biosynthese von 
Dichloroisoeverninsdure [Gaisser, S., Trefzer, A., Stockert, S., Kirschning, 

20 A., & Bechthold. A. (1997). J Bacteriol. 179, 6271-6278]. 

Die durch die umfangreiche Klonierung entdeckten Sequenzen der an der 
Synthese des Avilamycins beteilgten ubrigen ORF's sind ebenfails der 
Abb. 1 zu entnehmen wie auch die relative Anordnung auf dem Gencluster 

25 der Abb. 109. Hierbei eriaubt die Angabe der laufenden Nr. aus Tabelle 1 
die Zuordnung zur namentlichen Bezeichnung der ORFs. Unter der 
namentlichen Bezeichnung sind die Sequenzen Abb. 1 zu entnehmen und 
zwar auf die in der Beschreibung von Abb. 1 dargestellte Weise. Die 
genaue Klonierungsstrategie sowie weitere Einzelheiten der 

30 Sequenzierung sind in den Beispielen dargestellt ebenso wie die 
funktionelle Analyse und Charakterisierung der gefundenen Gene 
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(ORF's). Die Zuordnung der ORF-KQrzel zu Funktion und Sequenz (incl. 
abgeleiteter Proteinsequenz) kann der der Abbildungsbeschreibung 
folgenden Tabelle 1 entnommen werden. 



5 Ein weiterer wichtiger Gegenstand der Erfindung ist daher eine (oder 
mehrere) Nukleinsaure(n), die in ihrer Sequenz zu mindestens 95%, 
vorzugsweise 97%, insbesondere genau, der Nukleinsduresequenz 
gemaU einer der Sequenzen der laufenden Nummer 1 bis 51 gema& 
Tabelle 1 i.V.m. Abb. 1 entspricht/entsprechen oder aber mit einer dieser 
10 Sequenzen unter ma&ig stringenten Bedingungen hybridisiert. 
Insbesondere werden auch Sequenzen mit den laufenden Nr. 48 und 49 
(gema& Tabelle 1 und Sequenzdarstellung in Abb. 1) mit Funktion als 
rRNA-Methyltransferasen (avIRa und avIRb) und auch die Sequenzen mit 
den laufenden Nr. 50 und 51 (gemaB abelle 1 i.V.m. Abb. 1) mit Funktion 
15 als ABC-Transporter-Gene (aviABCI and aviABC2), die Resistenzen 
gegen Avilamycin vermittein, bzw. Sequenzen, die zu mindestens 95% 
diesen Sequenzen mit den vorgenannten laufenden Nr. entsprechen oder 
aber mit einer dieser Sequenzen unter ma&ig stringenten Bedingungen 
hybridisieren, in der vorliegenden Erfindung beschrieben. Im ubrigen auch 
20 Mischungen von Nukleinsauren, die beliebige Unterkombinationen der 
gemad Abb. 1 dargestellten Nukleinsauren mit den laufenden Nr. 1 bis 51 
aus Tabelle 1 darstellen, bspw. Mischungen aus zwel, drei, vier, 50 
Nukleinsauren in beliebiger Kombination sind erfindungsgemSQ 
mitoffenbart, ggf. auch als Kombination auf einem Nukleinsaurestrang 
25 Oder auf verschiedenen Strangen. 

Dabei ist/sind insbesondere (eine) Nukleinsaure/n bevorzugt, die zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gema& einer der Sequenzen mit der laufenden Nr. 1 
30 bis 32 gemaB Tabelle 1 (i.V.m. Abb. 1), vorzugsweise 1 bis 7, 
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insbesondere 1 oder 2. entspricht/entsprechen oder die aber mit einer 
dieser Sequenzen unter maKig stringenten Bedingungen hybridisiert/en. 

Ein weiterer Gegenstand der Erfindung sind entsprechend auch 
5 Gencluster, die „Open reading frames", vorzugsweise 54, enthalten. die in 
ihrer Nukleinsauresequenz zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, den Nukleinsauresequenzen gemd& den Sequenzen 
mit den laufenden Nummern 1 bis 54 (Tabelle 1 i.V.m. Abb. 1) 
entsprechen oder aber mit einer dieser Sequenzen unter m3Gig 
10 stringenten Bedingungen hybridisiert und die auf einem 
Nukleinsaurestrang oder in beliebiger Kombination auf dem einem oder 
dem anderen Strang angeordnet sind, vorzugsweise gemaB Abb. 109. 
Die Gene in einem erfindungsgemaBen Gencluster konnen 2, drei, vier, ... 
, 50 erfindungsgemaBe Gene in beliebiger Strangverteilung und 
15 Unterkombination enthalten, insbesondere konnen die zwischen den 
ORFs liegenden Abschnitte beliebiger Nukieotidsequenz sein. 

Damit ist insbesondere ein Gencluster gemaH Abb. 109 gemeint, aber 
auch Gencluster, die entsprechende Nukleinsauren, evt. auch in anderer 
20 Anordnung enthalten, wobei bevorzugt - aber nicht notwendig - ist, daU 
alle ORFs gemSS den laufenden Nummern 1-54 (Tabelle 1 i.V.m. Abb. 1) 
im Gencluster zu finden sind. 

Unter dem Begriff Gencluster versteht man im Sinne dieser Erfindung ein 
25 Abschnitt einer DNA. auf dem sich in enger raumlicher Nachbarschaft 
mehrere Gene befinden. Derartige erfindungsgemaSe Gencluster konnen 
in einem Vektdr vorliegen, bspw. einem BAG oder YAC, einem Cosmid 
Oder Plasmid. Vektoren, die mindenstens eine erfindungsgema&e 
Sequenz enthalten, sind damit gleichfails Gegenstand der vorliegenden 
30 Erfindung. ErfindungsgemaSe Gene konnen in erflndungsgemSBen 
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Vektoren rriit weiteren Signalsequenzen Oder weiteren Genen, 
insbesondere weiteren Antibiotika-Resistenz-Genen, kombiniert werden. 

Aus den neu entdeckten Sequenzen der ORF's bzw. Gene lieden sich 
5 Protein- und Polypeptidsequenzen ableiten. Entsprechend ist ein weiterer 
Gegenstand der Erfindung ein Protein oder Polypeptid, das in seiner 
Aminosduresequenz zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der Aminosduresequenz gemad einer der 
Sequenzen mit den laufenden Nr. 55 - 101 (Tabelle 1 i.V.m. Abb. 1) 
10 entspricht. 

Dabei ist es bevorzugt, wenn das erfindungsgemaSe Protein oder 
Polypeptid zu mindestens 95%, vorzugsweise 97%. insbesondere genau. 
der Nukleinsauresequenz gemaB einer der Sequenzen mit den laufenden 
15 Nr. 55 bis 86 (Tabelle 1 i.V.m. Abb. 1), vorzugsweise 55 bis 61, 
insbesondere 55 oder 56, entspricht. 

Ein weiterer Gegenstand ist entsprechend auch ein Protein oder 
Polypeptid, das durch eine Nukleinsdure gemaH einem der AnsprUche 12 

20 Oder 13 kodiert wird. Dabei versteht man unter „kodieren" im Sinne dieser 
Erfindung, da& die Codons (s.o.) des entsprechenden 
Nukleinsaureabschnitts (Gen oder ORF) fur die entsprechende 
Aminosauresequenz kodieren, also nach Transkription und Translation ein 
entsprechendes Protein oder Polypeptid mit dieser Aminosauresequenz 

25 entsteht. 

Insbesondere sind die erfindungsgemaHen Proteine Enzyme, bzw. Teil 
eines Multienzymkomplexes. Sie kdnnen aber naturlich auch andere 
Funktionen haben. 



30 
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Da zum einen die erfindungsgemaBen Avilamycin-Derivate uber ein 
gentechnologisches bzw. biotechnologisches Verfahren definiert sind Oder 
dadurch hergestellt werden, auf der anderen Seite die neu entdeckten 
Gene bzw. Proteine (Enzyme) in gen- bzw. biotechnologischen Verfahren 
5 zur Herstellung entsprechender Antibiotika eingesetzt werden konnen, 
haben im Rahmen dieser Erfindung nahezu zwangsldufig 
gentechnologisch veranderte Zellen eine wichtige Funktion. 



Ein weiterer Gegenstand dieser Erfindung sind daher gentechnologisch 
10 veranderte Zelle enthaltend mindestens eine nicht-endogene 
erfindungsgemalie Nukleinsaure, einen nicht-endogenen 
erfindungsgemaSen Gencluster und/oder ein nicht-endogenes 
erfindungsgemaBes Protein oder Polypeptid. 

15 Ebenso ist eine Zelle ein weiterer Gegenstand der Erfindung, die 
mindestens eine gentechnologisch veranderte Nukleinsaure, deren 
Sequenz vor der Veranderung zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der Nukleinsduresequenz gemaB einer der 
Sequenzen mit der laufenden Nr. 1 bis 54 (Tabelle 1 i.V.m. Abb.1) 

20 entsprach oder aber die mit einer dieser Sequenzen unter mdllig 
stringenten Bedingungen hybrid isierte, enthalt. 

Ein besonders bevorzugter Gegenstand der Erfindung ist eine Zelle vom 
Typ Streptomyces viridochromdgenes, vorzugsweise vom Subtyp Tu57, 

25 bei dem mindestens eine der Nukleinsauren mit einer Sequenz mit einer 
der laufenden Nr. 1-54 (Tabelle 1 i.V.m. Abb. 1) gentechnologisch 
verandert oder deletiert wurde. Dabei Ist es besonders bevorzugt, wenn in 
der entsprechenden Zelle mindestens eine der Nukleinsauren mit einer 
Sequenz mit einer laufenden Nr. 1, 2-7 oder 48-49 (Tabelle 1 i.V.m. Abb. 

30 1), vorzugsweise 1 oder 2-7, insbesondere 1 und/oder 2 gentechnologisch 
verandert oder deletiert wurde. 
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GemaB obigen Ausfuhrungen ist entsprechend ein weiterer Gegenstand 
der Erfindung die Verwendung einer erfindungsgemd&en Nukleinsaure, 
eines erfindungsgemaf^en Genclusters, eines erfindungsgema&en 
5 Proteins oder Polypeptids und/oder einer der erfindungsgemd&en Zeilen 
zur Herstellung eines Avilamycin-Derivats, vorzugsweise eines 
erfindungsgemaQen Avilamycin-Derivats. 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung 
10 erfindungsgemaHer Avilamycin-Derivate mit folgenden Schritten: 

(1) in einer kultivierbaren Zelle, die die notigen Gene bzw. Enzyme 
zur Synthese des Orthosomycin-Grundkorpers bestehend aus 

15 (a) einem endstandigen Dichloroisoeverninsaure-Rest (A in 

Forme! I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
Orthoesterbindungen verknUpften Heptasaccharid (B bis H 
in Formel I) aus: 

20 

(i) zwei D-Olivose-Resten (B und C) 
(11) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose (E), 

(iv) einem D-Mannose-Rest (F), 
25 (v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-)Eurekanat Rest (H) 

aufweist, wird mindestens eine Nukjeinsaure, deren Sequenz 
zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
30 ^ der Nukleinsduresequenz mit einer der laufenden Nr. 1 bis 54 

gemSQ Tabelle 1 i.V.m. Abb. 1 entspricht oder aber eine 
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Nukleinsaure, die mit einer dieser Sequenzen unter maBig 
stringenten Bedingungen hybridisiert, gentechnologisch 
verandert, deletiert Oder nicht exprimiert, 



5 (2) die so gentechnologisch verdnderte Zelle wird kultiviert, 

(3) der Kulturuberstand wird gewonnen, 

(4) der KulturOberstand wird aufgearbeitet und dabei das Oder die 
entstandene/n Avilamycin-Derivat/e aufgereinigt und isoliert, 

(5) gegebenenfalls werden unterschiedliche Derivate getrennt. 

10 

Es ist bevorzugt, wenn bei diesem Verfahren die kultivierbare Zelle 
ausgewahit ist aus einer Zelle vom Typ Streptomyces viridochromogenes 
Oder einer Zelle, die mit Ausnahme der gentechnologisch veranderten, 
deletierten oder nicht exprimierten Nukleinsaure die Nukleinsauren gemad 

15 laufenden Nr. 1-54 gema& Tabelle 1 i.V.m. Abb. 1 bzw. dazu zu 
mindestens 95%, vorzugsweise 97 %, homologe Nukleinsauren oder aber 
mit diesen Sequenzen hybridisierende Sequenzen enthalt oder den 
erfindungsgema&en Gencluster enthdlt. Letzteres wird in der Fachliteratur 
als heterologe Expression bezeichnet. Dabei ist es besonders bevorzugt, 

20 wenn die Zelle ausgewahit ist aus einer Zelle vom Typ Streptomyces 
viridochromogenes, Streptomyces Lividans, Streptomyces albus oder 
Streptomyces fradlae, insbesondere einer Zelle vom Typ Streptomyces 
viridochroniogenes TQ 57 Oder A 23575. 

25 Auch eine alternative Verfahrensfuhrung kommt erfindungsgemaB in 
Betracht. Hierbei wird nach Durchfuhrung der Verfahrensschritte (1) und 
(2) jedoch das Avialmycin-Derivat nicht aus dem Kulturuberstand 
gewonnen, sondern dieses akkumuliert sich vielmehr In den Wirtszellen. 
Gema& dem alternativen Verfahren werden daher in Verfahrensschritt (3) 

30 die Wirtszellen geemtet, nachfolgend aufgeschlossen und die Avilamycin- 
Derivate von den ubrigen Zellbestandteilen getrennt und schlie&lich 
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aufgereinigt. Zur Trennung und Aufreinigung konnen die vorgenannten 
und alle dem Fachmann gelaufigen Verfahren zum Einsatz kommen. 

Weiter bevorzugt ist es, wenn bei dem erfindungsgemaBen Verfahren die 
5 veranderte/n Nukleinsaure/n fur eine Methyltransferase und/oder fiir eine 
Halogenase kodiert/en. Oabei ist es besonders bevorzugt, wenn die 
Sequenz der veranderte/n Nukleinsdure/n vor der Verdnderung zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz einer der Sequenzen mit den laufenden Nr. 1, 2-7 
10 Oder 48-49 gemaQ Tabelle 1 i.V.m. Abb. 1, vorzugsweise einer 
Sequenzen rDit den laufenden Nr. 1 oder 2-7 gemaB Tabelle 1 i.V.m. Abb. 
1, insbesondere einer der Sequenzen mit den laufenden Nr. 1 und/oder 2 
gemaB Tabelle 1 i.V.m. Abb. 1 , entsprach. 

15 Weiter bevorzugt ist es, wenn bei dem erfindungsgemaBen Verfahren die 
Veranderung der Nukleinsaure/n, insbesondere von erfindungsgemaBen 
Methyltransferasen und/oder Halogenasen, dazu fuhrt, daB das oder die 
durch die gentechnolgisch verdnderte/n Nukteinsaure/n kodierte/n 
Proteln/e oder Polypeptid/e nach der gentechnologischen Verdnderung 

20 nicht mehr synthetisiert wird/werden. 

Die erfindungsgemaBen Avilamycin-Derivate sind prinzipiell toxikologisch 
unbedenklich, so daS sie sich als pharmazeutischer Wirkstoff in 
Arzneimittein eignen. Ein weiterer Gegenstand der Erfindung sind daher 

25 Arzneimittel enthaltend mindestens ein erfindungsgemaSes Avilamycin- 
Derivat, vorzugsweise mindestens zwei, insbesondere auch Mischungen 
von einem oder mehreren Avilamycin-Derivaten mit mindestens einem 
weiteren Antibiotikum aus dem Stand der Technik, bspw. Vancomycin, 
Penicillin, Streptomycin, Neomycin, Kanamycin, Sisomycin, Amikacin 

30 und/oder Tobramycin, sowie gegebenenfalls geeignete Zusatz- und/oder 
Hilfsstoffe. Auch andere bakteriostatische oder bakterlzide Substanzen 
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kdnnen mit erfindungsgemaBen Substanzen kombiniert werden, bspw. 
Cephalosporine, Chloramphenicol, Ethambutol. Cephalosporine. 
Isonicotinamide. Tetracycline, Sulfonamide, Oxalactame (bspw. Flomoxef, 
Clavulansaure) und/oder Nitrofurane. 

5 

Darunter versteht man insbesondere auch Tragemnaterialien, Fullstoffe, 
LOsungsmittel, VerdQnnungsmittel, Farbstoffe und/oder Bindemittel. Die 
Arzneimittel kdnnen als flQssige Arzneiformen in Form von 
Injektionslosungen, Tropfen oder Saften. als halbfeste Arzneiformen in 

10 Form von Granulaten, Tabletten, Pellets, Patches, Kapsein, Pflaster oder 
Aerosolen verabreicht werden. Die Auswahl der Hilfsstoffe etc. sowie die 
einzusetzenden Mengen derselben hangen davon ab, ob das Arzneimittel 
oral, peroral, parenteral, intravenos, Intraperitoneal, intradermal, 
intramuskular, intranasal, buccal, rektal oder ortlich, zum Beispiel auf die 

15 Haut, die Schleimhdute oder in die Augen, appliziert werden soli. Fur die 
orale Applikation eigneh sich Zubereitungen in Form von Tabletten, 
Dragees, Kapsein, Granulaten, Tropfen, Saften und Sirupen, fur die 
parenterale, topische und inhalative Applikation Losungen, Suspensionen, 
leicht rekonstituierbare Trockenzubereitungen sowie Sprays. 

20 

Oral Oder perkutan anwendbare Zubereitungsformen kdnnen die 
erfindurigsgema&en Avilamycin-Derivate verzogert freisetzen und so 
einen gleichmaBigeren Piasmaspiegel erreichen. Prinzipiell kdnnen den 
erfindungsgemaBen Arzneimittein andere dem Fachmann bekannte 
25 weitere Wirkstoffe zugesetzt werden. 



Die an den Patienten zu verabreichende Wirkstoffmenge variiert in 
Abhangigkeit vom Gewicht des Patienten, von der Applikationsart, der 
Indikation und dem Schweregrad der Erkrankung. Ubiichen/veise werden 
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0,005 bis 1000mg/kg, bevorzugt 0,05 bis 5 mg/kg wenigstens eines 
erfindungsgema&en Avilamycin-Derivats appliziert. 

Da fur die erfindungsgema&en Avilamycin-Derivate eine antibiotische 
5 Wirkung nachgewiesen ist, eignen sie sich naturlich prinzipiell zur 
Behandlung von Erkrankungen, insbesondere zur Behandlung von 
Infektionskrankheiten, bzw. zur Herstellung eines arzneimittels zur 
Behandlung derartiger Erkrankungen. Bin weiterer Gegenstand der 
Erfindung ist entsprechend die Verwendung eines erfindungsgema&en 
10 Avilamycin-Drivats zur Herstellung eines Arzneimittel mit antibiotischer 
Wirkung zur Behandlung von bspw. Infektionskrankheiten. Unter 
Infektionserkrankungen werden Erkrankungen Verstanden, denen eine 
Infektion mit einem viralen, einem bakteriellen oder einem 
protozoologischen Erreger zugrundeliegt. Damit sind die vorliegenden 
15 erfindungsgema&en Antibiotika auch zur Behandlung von Mykosen, 
insbesondere kutanen und subkutanen Mykosen, geeignet. 

Bevorzugt werden die erfindungsgemaBen Avilamycin-Derivate jedoch zur 
Bekampfung bakterieller tnfektionen eingeset2:t. insbesondere sind 
20 Infektionen mit den folgenden Erregern zu hennen: Leprabakterien, 
Mykobakterien, Nelsserien, Tuberkulosebakterien, Aktinomyceten, 

A 

/UP* Corynebakterien, LIsterien, Clostridien, Bazlllen, Enterokokken, 

Streptokokken, Staphylokokken, insbesondere auch zur Behandlung von 
Infektionen mit Staphylococcus aureus Stammen, Rickettsien, 

25 Chlamydien. Mykoplasmen, Borrelien, Spirochaten, Brucellen. 
Bortedellen. Pseudomonaden, Helicobacter. Hamophilus, Vibrionen. 
Shigellen, Yersinia, Salmonellen und weitere unter die Familie der 
Enterobacteriaceae fallende Vertreter. Entsprechend werden die 
erfindungsgemd&en Substanzen zur Behandlung aller klinischen 

30 Krankheitsbilder, die durch bspw. die vorgenannten Bakterienstdmme 
verursacht werden, verwendet. Beispielhaft seien die folgenden 



-29- 



Krankheitsbilder genannt: Tuberkulose; Pneumonien; Typhus; Paratyphus; 
Lues; Gastritis; Gastroenteritis; Ruhr; Pest; Enteritis; extraintestinale 
Infekte, Peritonitis und Appendizitis nnit E. coli sowie intestinale Infekte mit 
EHEC. EPEC, ETEC Oder EIEC; Cholera, Legionarskrankheit. 
5 Keuchhusten, Brucellosen, Lyme-Borreliose, Leptospirose, Fleckfieber, 
Trachom, Gonon^hoen, Meningitis, Septlkamie, Lepra etc. 

Ein weiterer Gegenstand des Verfahrens ist aiich die Behandlung eines 
Menschen Oder Tieres, der oder das diese Behandlung benotigt, mit 




10 einem erFindungsgemSHen Avilamycin-Derivat, vorzugsweise bei 
Infektionskrankheiten, insbesondere uhter Beteiligung von Staphylococcus 
aureus. 



15 Im folgenden Abschnitt wird die Erfindung welter durch Belspiele erlautert, 
ohne sle darauf zu beschranken. 



Beispiele und Abbildungen: 

20 Abbildungen: 

Abbildunq 1 z eiat die Sequenz des gesamten Genclusters mit seinen 54 

•v ... 

Nuleinsauresequenzen der ORF's aus Streptomyces viridochrpmogenes 
TO 57. In Abbildung 1 sind die Kurzbezeichnungen der entsprechenden 
Nukleinsauresequenzen enthalten, wobei diese Kurzbezeichnungen (ohne 
25 das Prafix ,Avil Jewells an den Zeilen eingefugt sind, die die Startcodons 
der 54 Sequenzen aufweisen. Die AS, die durch das jeweilige Startcodon 
codiert wird, ist eingekreist. Der an diesen Steljen jeweils eingezeichnete 
Pfeil gibt die Leserichtung (rQckwarts oder vorwarts) der Gene mit dem 
Startcodon als Ausgangspunkt wieder. 

30 
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Abb. 1 enthdit die Nukleotidsequenzen der beiden komplementaren DNA- 
Strange ebenso wie die (tw. fiktiven) AS-Sequenzen fur beide Strange in 
alien drei Leserastern. insgsamt also 2 Nukleotidsequenzen und die sich 
hieraus potentiell ergebenden 6 Proteinsequenzen (Ein-Buchstaben- 
5 Code). Die drei Proteinsequenzen des oberen Nukleotidstrangs sind 
oberhalb der dazugehdrigen Nukleotidsequenz, die drei Proteinsequenzen 
des unteren komplennentdren Nukleotidsequenz unterhalb des 
dazugehdrigen unteren Nukleotidstrangs eingezeichnet. Die 54 namentlich 
in Abb. 1 eingezeichneten Proteinsequenzen im Gencluster ergeben sich 
10 aus Abb. 1 dadurch, da& eine eingekreiste AS als Ausgangspunkt gew3hlt 
wird und dann in diesem Leseraster, d.h. in der entsprechenden Zeile 
(bspw. 2. Zeile unterhalb der unteren Nukleotidsequenz), die AS-Sequenz 
in der durch die Pfeile angegebenen Richtung, also im folgenden 
entweder vorwarts oder ruckwarts. abgelesen wird. Die Sequenz endet 
15 mit dem Stop-Codon im entsprechenden Leseraster, wobei Stop-Codons 
durch ein „Stern"-Symbol in der enrsprechenden Zeile markiert sind. 

Die zur AS eines ORFs gehOrige Nukleotidsequenz ergibt sich durch das 
entsprechende oberhalb oder unterhalb (fUr den oberen Strang) 
20 befindliche Triplett. Die Ein-Buchstaben-Bezeichnung der Aminosaure ist 
dabel jeweils so angeordnet, da& sie oberhalb oder unterhalb des 
^oP^ mittleren Nukleotlds des fQr diese AS codierenden Codons liegt. 




In der nachfolgenden Tabelle sind die namentlichen Bezeichnungen der 
25 54 codierenden Bereichen im Gencluster jeweils laufenden Nummern 
zugeordnet, wobei die laufenden Nummern 1 bis 54 die 
Nukleotidsequenzen angeben und die laufenden Nummern 55 bis 108 den 
jeweils dazu gehdrigen AS-Sequenzen entsprechen, und zwar codiert die 
Nukleotidsequenz mit der laufenden Nummer 1 fUr die AS mit der 
30 laufenden Nummer 55, die Nukleotidsequenz mit der laufenden Nummer 2 
fQr die AS mit der laufenden Nummer 56 etc.. 
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Abbildung 109 zeigt die relative Anordnung der gefundenen ORF's auf 
dem Gencluster. 



Abbildung 110 zeigt einen Southern-Blot mit der Mutante S. 
viridochromogenes GW4. 



Abbildung 111 zeigt das Massenspektrum der Produkte von Mutante S. 
viridochromogenes GW4 



Abbildung 112 zeigt Massenspektrum der hydrolysierten Produkte von 
Mutante S. viridochromogenes GW4. 



Die Zuordnung der ORF-Kurzel zu ihrer Funktion und Sequenz (incl. 
abgeleiteter Proteinsequenz) kann der folgenden Tabelle 1 entnommen 
werden. 



Tabellel: 



Gen (ORF)/ 


Funktion 


Laufende Nr.: 


Protein bzw. 




Gen (ORF) / 


Polypeptid 




Protein bzw. 






Polyp ptid 






In Abb. 1 


AviX1 


Regulation 


8/62 


AviX2 




33/87 


AviX3 




34/88 


AviX4 




35/89 


AviX5 




36/90 


AviRb 


Resistenz/ Methylierung der rRNA 


48/102 


AviX6 




37/91 


AviX7 




38/92 


AviX8 




39/93 



-32- 



AviRa 


Resistenz/Methylierung der rRNA 


49/103 


AviQ1 


Zucker-Biosynthese 


9/63 


AviGT2 


Biosynthese der Heptasaccharid-Kette 


10/64 


AviX9 




40/94 


Avid 


Regulation 


11/65 


AviC2 


R^ulation 


12/66 


AviXIO 




41/95 


AviX1 1 




42/96 


AviG1 


Zucker-Biosynthese (2-Deoxy-D-Evalose)/ 
Modifikation (Methylierung) 


3/57 


AviJ 


Antibiotika Transport 


13/67 


AviN 


Biosynthese der Orsellin-Saure 


14/68 


AviM 


Biosynthese der Orsellin-Saure 


52/106 


AviD 


Zucker-Biosynthese (D-Olivose, 2-Deoxy- 
D-Evalose) 


53/107 


AviE1 


Zucker-Biosynthese (D-Olivose, 2-Deoxy- 
D-Evalose) 


54/108 


AviQ2 


Zucker-Biosynthese 


15/69 


AviG5 


Modifikation (Methylierung) 


6/60 


Avid 




43/98 


AviGTI 


Biosynthese der Heptasaccharid-Kette 


16/70 


AviE2 


Zucker-Biosynthese 


17/71 


AviG2 


Modifikation (Methylierung) 


4/58 


AviZ1 


Zucker-Biosynthese 


18/72 


AviG6 


Modifikation (Methylierung) 


7/61 


Avi03 




44/98 


AviG3 


Modifikation (Methylierung) 


5/59 


AviX12 




45/99 


AviABCI 


Antibiotika Transport 


50/104 


AviABC2 


Antibiotika Transport 


51/105 


AviB1 


Modifikation 


19/73 


AviB2 


Modifikation 


20/74 


AviGT3 


Biosynthese der Heptasaccharid-Kette 


21/75 


AviGT4 


Biosynthese der Heptasaccharid-Kette 


22/76 


Avi02 




46/100 


AviP1 


Zucker-Biosynthese (L-Lyxose) 


23/77 


AviQS 


Zucker-Biosynthese 


24/78 


AvIH 


Modifikation (Haiogenlerung) 


1/55 


AviX13 




47/101 


AviG4 


Modifikation (Methylierung) 


2/56 


AviE3 


Zucker-Biosynthese (4-0-methyl-L-fucose) 


25/79 


AviS 


Zucker-Biosynthese (D-Olivose, 2-Deoxy- 
D-Evalose) 


26/80 


AviT 


Zucker-Biosynthese (D-Olivose, 2-Deoxy- 
D-Evalose) 


27/81 
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AviZ3 


Zucker-Biosynthese (D-Olivose, 2-Deoxy- 
D-Evalose) 


28/82 


AviZ2 


Zucker-Biosynthese 


29/83 


AviX14 


Regulation 


30/84 


AviXIS 


Regulation 


31/86 


AviX16 


Regulation 


32/86 



Beispiele 



5 Beispiel 1: 

Allgemeine Methoden und Materialien: 

a) 

Bakterienstamme, Plasmide und Kulturbedingungen. 

10 

Streptomyces viridochromogenes Tu57 wurde mit 1 % Malzextrakt, 0.4 % 
Hefeextrakt. 0.4 % Glucose and 1 mM CaCb. bei einem pH von 7.2 (HA 
medium) bei 37°C kultiviert. Zur Herstellung von Avilamycin wurden 
Streptomyces viridochromogenes Tu57 und alle Mutatnten in NL19+- 

15 Medium, das 2% D-l\/lannitoi, 2% Sojamehl und 20 mM L-Valin enthielt 
und auf pH 7.5 eingstellt war, kultiviert. Fur die DNA-Manipulation wurde 
Escherichia coli XL-1 Blue MRF' (Stratagene) als Wirtszeile benutzt. Vor 
der Transformation von S. viridochromogenes Ju57 wurden die Plasmide 
in E . coli ET 12567 (dam--, dcm--, hsdS, Cm^) gezogen, um unmethylierte 

20 DNA zu erhalten. E. coli Stamme wurden auf Luria-Bertani (LB) agar oder 
flussigem Medium, das das geeignete Antibiotikum enthielt, kultiviert. 



25 



b) 

Allgemeine qentechnoloqische Manipulationen, PGR and DNA 
Sequenzierung / Sequenz-Analvsis 
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Es wurden Standard-Methoden der Molekularbiologie - wie dem 
Fachmann bekannt - durchgefQhrt. Die Isolierung von E.coli plasmid DNA, 
DNA Restriktion. DNA Modifizierung wie das „filling-in sticky ends" und die 

s „Southern''-Hybridisierung wurden gemSB den Protokollen der Hersteller 
der Kits, Enzyme und Reagentien durchgefQhrt (Amersham-Phamnacia, 
Boehringer i^annheim, Promega, Stratagene). Streptomyces 
Protoplastenbildung, -transformation, and -protoplast Regenerierung 
wurden wie ubiich durchgefQhrt. Die PGR wurde mit einem Perkin Elmer 

10 GeneAmp 2400 thermal cycler durchgefQhrt, wobei die Bedingungen so 
wie beschrieben und Qblich waren. Die venA/endeten Oligonukleotid-Primer 
waren: 

AviG4F (5'-GGACGCCTATCTGTGCCACCCCTTCCTGGT-3 ), 
15 AviG4R (5 .-TGAGCGCTCGCCTAGACAGAATCATCTCCC3'), 
S2A (5'-GCGTCCATCTTGCCGGGA-3') und 
S2B (5 ,-CGTGGATCCCGCCGGCCC-3'). 

Die Nukleotidsequenzierung wurde mit der Dideoxy- 
20 Kettenabruchsmethode unter Verwendung eines automatischen Laser- 
Fluorescenz-Sequencers (Perkin Elmer ABI) durchgefilhrt. Die 
Sequenzierungs-Reaktionen wurden mit einem Thermosequenase-Cycle- 
Sequencing Kit with 7-deaza-dGTP (Amersham) and Standard-Primems 
(M 13 universal and reverse, T3, T7) durchgefQhrt. Mit dem DNASIS- 
25 Software-Packet (version 2.1, 1995; Hitachi Software Engineering) wurde 
eine computerunterstutzte Sequenz-Analyse und die Datenbank- 
Recherche mit dem BLAST 2.0 program auf dem Server des National 
Center for Biotechnology Information, Bethesda MD, USA, durchgefQhrt. 
Die vorgelegten Sequenzen sind in der Genbank-Datenbank unter der 
30 Zugangsnummer (,Accession Number") AF333038 abgelegt. 
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c) 

Konstruktion eines Gen-inaktivierenden Plasmids 

5 aviG4: Eine einmal vorkommende A/col-Restriktionsschnittsteile im Gen 
awG4 (laufende Nr. 2, Abb. 1), die auf dem 1.9 Fragment liegt, das in die 
Sad and EcoR\ Schnittstellen von pBSK- ligiert ist, wurde fUr die gezielte 
Inaktivierung durch ein Verschieben des Leserahmens ausgewahlt. Das 
1.9 kb Fragment wurde mit Sad and Kpnl verdaut und wurde in das Gen- 
10 Inaktivierungsplasmid pSP 1 hinein ligiert. Nach dem Restriktionsverdau 
mit A/col, Behandlung mir dem Klenow -Fragment der E. coli DNA- 
polymerase 1 and erneuter Ligation wurde die beabsichtigte Veranderung 
durch DNA-Sequenzierung bestatigt. Das gebildete Plasmid wurde als 
PMIKG4E3 bezeichnet. 

15 

aviH: Die einmal vorkommende Nazi Schnittstelle im awH-Gen, das auf 
dem 3.7 kb Sad-Fragment ligiert in pBSK- vorliegt, wurde durch A/a/i- 
Restriktionsverdau und anschlieSender Behandlung wie fur aviG4 
beschrieben, verandert. Die Sequenzierung verschiedener Plasmide 
20 zeigte die korrekte Veranderung. Das 3.7 kb-Fragment wurde in pSPI 
kloniert, urn das Gen-lnkativierungs-Plasmid pSP liS2Nar zu bilden. 

d) 

Analyse neuer Avilamvcin A-Derivate 
25 TLC Analysis 

Streptomyces viridochromogenes Tu57 und die Mutanten GW-4 und 
GW4-AM1 wurden drei Tage lang inkubiert. Die Kulturen wurden abfiltriert 
und das Filtrat auf eine Festphasen Extraktions-Patrone aufgetragen 
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(SepPakCia, Waters). Die Patrone wurde mit einem Gradienten zwischen 
10 % und 100% Methanol in Wasser eluiert. Avilamycin-Derivate eluieren 
mit der Fraktron, die 60-70 % Methanol enthSit. Nach einer Extraktion mit 
Ethyi-Acetat und Abziehen des Ldsungsmittels wurden die Avilamycin- 
s Derivate wieder in Methanol geldst und mit TLC auf Silicagel-Platten (silica 
gel 60 F254, Merck) mit Methylenchlorid/Methanol (9:1. v/v) als 
Ldsungsmittel gemessen. Avilamycin-Derivate waren nach Behandlung 
mit Anisaldehyd/H2S04 detektiert worden. 

10 e) 

HPLC-UV-Analyse 

Eine analytische HPLC-UV wurde auf einem Hewlett Packard 1090 Liquid 
Chromatograph mit einem Photodioden-Anray-Detektor und einer HP- 
is ODS-Hypersil 5Mm, 200 x 2 mm Sdule durchgefOhrt. Die Mefiwellenldnge 
betrug 210 nm. Die Abfolge der Losungen war wie folgt: L5sung A, 0.04M 
(NH4)2HP04 pH 7.0 Puffer; LOsung B. 100% Methanol; ein nichtlinearer 
Gradient, mit 30-62% der Ldsung B Qber 25min bei einer FluBrate von 
0.2ml/min verteilt. 

20 

f) - 
HPLC-MS-Analyse 

Fur die HPLC-MS-Aanalyse wurden die Avilamycin-Derivate auf einer 
25 HPLC-Anlage (HP 1110. Hewlett-Packard, Waldbronn) mit einer HP CDS 
Hypersil Cis Sdule (2.1 by 100 mm; 5 pm) bei einer Flu&rate von 0.1 
ml/min, Detektion bei 220 nm und dem folgenden Gradienten laufen 
gelassen: 0-5 min von 0 % bis 20 % B. 5.1-120 min bis 90 % B (Losung A. 
H2O : MeOH 3:2; L5sung B, MeOH). Massenspektren wurden auf einem 
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Bruker Esquire-LC 1.6n Massenspektrometer (Bruker Daltonik, Bremen) 
mit einer Elektrospray (ES) lonenquelle (positive ion mode) aufgezeichnet. 
Die MeBbreite betrug zwischen 200 - 1800 m/z. 

5 g) 

GC-MS-Analyse 

Eine Analyse der neuien Gavibamycin-Derivate (erfindungsgema&en 
Avilamycin-Derivate), die durch die mutierte Zelle Streptomyces 

10 viridochromogenes GW4 synthetlsiert worden waren, wurde nach 
Etylierung mit GC-MS-Analyse durchgefuhrt. Die Derivate wurden in einer 
^ischung aus DMSO und Acetonitril (3:40) gelost. Nach Zugabe von 
Ethyliodid and K2CO3 lief die Reaktion uber Nacht ab. Nach Abziehen des 
Losungsmittels wurden die Derivate mit HCI/Methanol bei 115°C fur 15 

15 min hydrolisiert. Nach Abziehen des Losungsmittels wurden die Derivate 
mit Diethylether extrahiert und mit GC-MS analysiert. Ein Hewlett Packard 
5973 MSD System wurde verwendet um El (electron impact) Spektren 
(Saule: SE54, 12m x 0.25mm; df= 0.125m). 0\e Saulentemperatur wurde 
wie folgt programmiert: 50PC fur 2 min; 25^C/min bis lOO^C; 5°C/min bis 

> 250°C. 

\ 

Beispiel 2: 

Klonierung und Sequenzierung des Avilamycin Clusters 

25 

Ein 60kb Abschnitt des Chromosoms des S. viridochromogenes Tu57, das 
Gene enthalt, die an der Biosynthese von Avilamycin beteiligt sind, wurde 
kloniert und sequenziert. Eine Analyse der DNA-Sequenz ergab 54 „open 
reading frames". Es war bereits bekannt, dad das NDP-Glucose 4,6- 
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Dehydratase Gen aviE und das Orsigllinsaure Synthase-Gen aviM 
essentiell fur die Biosynthese von Avilamycin A sind. Es wurde die DNA, 
die die aviE und aw'M-Gene flankiert, isoliert und sequenziert, um den 
biosynthetischen Avilamycin-Gencluster zu identiflzieren. Ein 17,6 kb 
Stock upstream von aviM und ein 35.9 kb StQck downstream von aviE 
wurden sequenziert. Die sequenzierten Gene und ihre Funktion sind 
Tabelle 1 zu entnehmen. Abb. 109 zeigt die genetische Anordnung des 
biosynthetischen Avilamycin-Genclusters. Der Cluster wird durch ein 
Avilamycin-Resistenz-Gen (avIRb) und einem Desoxyzucker-Synthese- 
Gen (aviZ2) flankiert. Im Zentrum des sequenzierten Abschnitts sind 25 
Gene (aviXIO- aviGT4), die alle in gleicher Richtung transkribiert werden. 

Beispiel 3: 
Analyse der ORF's 

a) Allgemein 

Es wurde eine Computeranalyse der gefundenen Sequenzen der ORF's 
durchgefiihrt. Uberwiegend wurden die Ergebnisse eines 
Sequenzvergleichs mit den Kenntnissen uber die Biosynthese des 
Avilamycins in Verbindung gesetzt. Die Ergebnisse dieser auf die 
vorliegenden Experimente gestQtzten Oberiegungen sind in Tabelle 1 
abzulesen. 

> 

Im folgenden werden die funktionellen Oberiegungen an ausgewahlten 
Beispielen, insbesondere den Methyltransferasen und Halogenasen 
vorgesteilt. 



b) 

Gene mit iner Funktion 
Dichloroiso veminsaure 



in d r Biosynth se v n 
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AviM ist fur die Bildung von Orsellinsaure wdhrend der Avilamycin- 
Biosynthese verantwortlich. AviN, das upstream von aviM liegt, durfte fQr 
ein Enzym, das das Startsignal fUr Orsellinsaure-Synthese kontrolliert, 
s kodieren. Da die Biosynthese von Dichloroisoeverninsdure (A in Forme! I) 
ausgehend von Orsellinsaure Methylierung und Di-Halogenierung 
voraussetzt, wurde vermutet. dad AviG4, das DmpM, einer O- 
Demethyipuromycin-O-Methyitransferase aus S. alboniger (44% 
identische AS) ahnelt. und AviH, die PItA, einer Halogenase aus 
10 Pseudomonas fluorescens Pf-5, die an der Pyoluteorinbiosynthese (39% 
identische AS) beteiligt ist, ahnelt, fur die Modifizierung der Orsellinsaure 
verantwortlich sind. 

c) 

15 Gene mit einer Funktion in der Bioynthese von Desoxy-Zuckem. 

2-Deoxy-D-Evalose unterscheidet sich von D-Olivose in einer 
l\1ethylgruppe an C3-Position. Es ist anzunehmen, da& dNDP-4-keto-2,6- 
Didesoxy-D-Glucose ein wichtiges Zwischenprodukt in der Biosynthese 
20 dieses methylierten Desoxyzuckers ist. Methylierung durch AviG1, das 
TylCIII ahnelt, einer 3C-Methyltransferase aus S. fradiae (54% identische 
AS), und Ketoreduktion durch entweder AviZHoder AviZ2. die beide 
Ketoreduktasen and Oxidoreduktasen ahnein, komplettieren die 
Biosynthese. 

25 

d) 

Gene mit einer Funktion in der Modifikation der Heptasaccharid-Kette 



Neben aviGI, aviG4, aviRa and aviRb wurden vier weitere 
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Methyltransferase-Gene im Cluster gefunden (aviG2, aviG3, aviGS und 
av'iGB). Sie wurden dadurch als potentielle Methyltransferase-Gene 
Identifiziert. daB entweder ihr Produkt Methyltransferasen aus anderen 
Organismen ahnelt, oder daB sie Motive enthalten, die typischerweise in 
verschiedenen methylierenden Proteinen gefunden werden. Es wurden 
von einer erfindungsgemd&en Zellinie verschiedene Aviiamycln-Derivate. 
die keine Methylgruppe an verschiedenen Positionen im MolekUl 
enthielten, produziert. Das weist darauf hin, da& die Methylierung zu 
einem sehr spdten Zeitpunkt der Biosynthese erfolgt. AviG2, AviGS, AviGS 
und AviG6 dCirften am D-Fucose-Rest (E), D-Mannose-Rest (F) und am 
Methyl-Eurekanat-Rest (H) von Avilamycin A methylieren. 

Beispiel 4: 

Herstellung einer aWG4-Gen Substitutionsmutante 

Zur Inaktivierung von aviG4 wurde das Plasmid pMIKG4E3 konstruiert (s. 
Beispiel 1), um den Ersatz des Wildtyp-Gens durch ein mutiertes Allel zu 
eriauben. Nach Bildung von Protoplasten und Transformation von S. 
viridochmmogenes mit dem Plasmid pMIKG4E3, wurden Erythromycin 
resistente Kolonien erhalten. Die Transformationseffektivitat war ungefdhr 
10 Kolonien pro \ig Plasmid-DNA. Mehrere Kolonien wurden ohne 
Erythromycin auf Platten kultiviert, um nach dem Verlust der Rsistenz zu 
selektieren. Verschiedene sensitive Kolonien wurden erhalten. was darauf 
hindeutet, daB es sich um die Folge eines „double cross-over" handelt. 
25 Zwei Mutanten, G4/24/20 und G4/24/30, wurden weiter untersucht. PCR- 
Fragmente, die unter Benutzung der Primer aviG4F- und aviG4R-DNA von 
G4/24/20 und G4/24/30 amplifiziert wurden, konnten nicht von Nco\ 
geschnitten werden, wahrend PCR-Fragmente aus Wildtyp-DNA von 
diesem Enzym geschnitten werden konnten. Um die Deletion in aw64 
30 nachzuweisen wurden wie folgt Southem-Blot-Analysen durchgefuhrt. 
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Ncol-geschnittene. chromosomale DNA wurde aus G4/24/20 und 
G4/24/30 gewonnen. Als diese DNA mit einem 1 .9 kb-Fragment, das das 
ganze awG4-Gen enthielt, hybrid isiert wurde, wurde ein 11 kb-Fragment 
detektiert, wahrend die zu erwartenden 5 kb- and 6 kb-Fragmente in der 
5 S. viridochromogenes Tu57 Linie gefunden wurden (Abb. 110). Die 
Mutante G4/24/30 wurde unter dem neuen Namen S. viridochromogenes 
GW4 fur weitere Experimente genutzt. 

Beispiel 5 




10 Herstellung einer aWG4— aviH Doppelgen-Ersatz-Mutante 



Das Plasmid pSP 1 S2Nar wurde entwickelt, um das aviH-Gen 
auszuschalten (s. Beispiel 1). S. viridochromogenes GW4 Protoplasten 
wurden mit diesem Plasmid transformiert. Es traten ca. 20 erythromycin- 
15 resistente Kolonien pro pg DNA auf. Einige davon wurden zum Screening, 
ob die Erythromycin-Resistenz verloren geht (was ein „doub!e-cross-over" 
anzeigt), kultiviert. Die Mutante GW4-AM1 wurde fur weitere Experimente 
ausgewahlt. Ein 1.34 kb PCR-Fragment, das unter Verwendung der 
Primer S2A und S2B aus H/3/16 gewonnen wurde, konnte von Nari nicht 
. 20 geschnitten werden, wahrend das PCR-Fragment aus GW4 vom Enzym 
[f verdaut wurde. Um die Deletion in aviH nachzuweisen wurde eine 

Southern-Blot-Arialyse durchgefOhrt. Chromosomale DNA aus H/3/16 
wurde mit Nari geschnitten und mit einer 3,7 kb Sonde, die das awH-Gen 
enthielt, hybridisiert. Es wurde ein 5.7 kb-Fragment detektiert, wahrend 
25 bei chromosomaler DNA aus GW4 die Fragment erwartungsgemaB bei 
4.3 kb und 1.4 kb lagen (nicht gezeigt). 

Beispiel 6: 

Vervollstandigung von S. viridochromogenes GW4 and S. 
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virid chromogen sGW4-AM1 



Urn klar zu Uberprufen, ob die Mutation nur die gewUnschten und keine 
anderen Gene betrifft, wurden aviG4 und aviH hinter dem ennE-up 
5 promoter ligiert, in das Integrationsplasmid pSET152 einkloniert und durch 
Protoplasten-Transformation in die entsprechenden Mutanten eingefuhrt. 
Die Production von Avilamycin bzw. Gavibamycin wurde wieder 
hergestellt. Damit ist jede Art von „upstream"- Oder „downstream"-Effekt 
auszuschliessen. 

Beispiel 7: 

Analyse der neugebildeten Avilamycin-Derivate durch S. 
viridochromogenes GW4 und S. viridochromogenes GW4-AM1 



15 Avilamycin A (M+Na: 1425) und Avilamycin C (M+Na: 1427) wurden in 
Extrakten von S. viridochromogenes Tu57 durch Flussigchromatographie 
(LC)-Masenspektrometrie-Analyse nachgewiesen. Avilamycin C war die 
Hauptkomponente. Messung bei hoher Auflosung zeigte, daS beide 
Verbindungen 2 Chloratome enthalten, die an ihem typischen 
20 Isotopenmuster erkannt werden kSnnen. Die Masse der zwei durch S. 
viridochromogenes GW4 gebildeten Hauptverbindungen war 141 1 (M+Na) 
and 1413 (M+Na) (Abb. Ill) was zeigt, da& awG4 wirklich fQr eine 
Methyltransferase kodiert. Die Hauptprodukte der Mutante GW4 wurden 
isoliert, durch Behandlung mit Ethyliodid ethyliert und unter Verwendung 
25 von Methanol and Salzsalire hydrolysiert. Die Reaktionsprodukte wurden 
durch GC-MS analysiert. Das Massenspektren dieser Probe zeigten 
mehrere Peaks (Abb. 112). Der Peak by m/z 436 entspricht dem D- 
Olivosylester der Dichloro-di-O-ethyl-orsellinsaure und die meisten 
weiteren Peaks (m/z 405, m/z 275, m/z 247) entsprachen Fragmenten, die 
30 vom Orsellinsaure-Rest ausgehen (Abb. 112). Das legt den SchluH nahe, 
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dad die Differenz zwischen Avilamycin A (C) und dem neuen Derivat, 
Gavibamycin A1 (A3), aus einer Veranderung der Struktur des 
Orsellinsaure-Rests resultiert. 

5 Gavibamycin A1 und A3 entsprechen der allgemeinen Formel I mit der 
folgenden Bedeutung fur die Reste R1-R8: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


A1 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


A3 


COCH(CH3)2 


CH(OH)CH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 



S. viridochromogenes GW4-AM1 wurde auch durch HPLC-MS analysiert. 

10 Die Masse der zwei Haupt-Avilamycin-Derivate war 1343 (M+Na) und 
1345 (M+Na). Bei einem Vergleich des Isotopenmusters der Haupt- 
Derivate aus der Mutante GW4 zeigte das Isotopenmuster der 
Hauptprodukte der Mutante GW4-AM1 keine spezifischen Signale fur 
Chloridionen (Abb. Ill), was darauf hindeutet, da& die Inaktivierung von 

15 aviH zum Verlust beider Chlorid-Atome fuhrt. Die neuen Derivate wurden 
Gavibamycin B 1 (Avilamycin A-Analogon) und Gavibamycin B3 
(Avilamycin C-Analogon) genannt. 

Gavibamycin B1 und B3 entsprechen der allgemeinen Formel I mit der 
20 folgenden Bedeutung fur die Reste R1-R8: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


B1 


COCH(CH3)2 


COCH3 


OH 


H 


H 


CH3 


CH3 


OCH3 


B3 


COCH(CH3)2 


CH(OH)CH3 


OH 


H 


H 


CH3 


CH3 


OCH3 



Beispi I 8: 
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Biologische Eig nschaften von Giavibamycin A3 

Das antimikrobielle Spectrum von Gavibamycin A3 wurde bestimmt und 
mit dem von Avilamycin A verglichen. Dabei wurde die „broth- 
5 microdilution''-Methode gemd& den Vorschriften des nationalen 
Kommittees fur klinische Labor-Standards angewandt. Beide Metaboiiten 
zeigten antibiotische Aktivitat gegen Bacillus subtilis, Staphylococcus 
aureus ATCC6538, Staphylococcus aureus ATCC6538P, Staphylococcus 
aureus ATCC29213, Staphylococcus aureus Q48-1.2.1, Enterococcus 
10 faecalis ATCC29212, Enterococcus faecalis H-7-6 and Streptococcus 
pneumoniae ATCC4961 9. 

Erste Tests zeigen weiter, dad Gavibamycin A3 etwas aktiver gegen 
verschiedene Staphylococcus aureus Stamme ist als Avilamycin A und es 
15 scheint zusatzlich viel hydrophiler zu sein wie an den Rf-Werten 
abzusehen ist. Auch die nicht-chlorierten Gavibamycin-Derivate waren 
antibiotisch aktiv. 

Beispiel 9 
20 Parenterale Applikationsform 

65 g Gavibamycin A3 werden In 1 I Wasser fur Injektionszwecke bei 
Raumtemperatur geldst und anschlie&end durch Zugabe von wasserfreier 
Glukose fur Injektionszwecke auf isotone Bedingungen eingestellt. 

25 Appliziert werden davon bei einem Durchschnlttspatienten von ca. 65 kg 
Kdrpergewicht beispielsweise 0,5 ml also 32,5 mg bzw. » 500 \ig/kg. Die 
verabreichte Dosis zeigte keinerlei Kontraindikation und envies sich fUr die 
Patienten als gut vertraglich. 
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Zusammenfassend ist festzustellen, daS erfindungsgemaR eine detaillierte 
Sequenzanalyse des aw Gensatzes mehrere Merkmale aufweist, die ein 
Modell eines biosynthetischen Stoffwechselwegs zu erfindungsgemaSen 
komplexen Oligosaccharid-Antibiotika vorschlagen. Die Funktion der fur 
5 die Zuckerbiosynthese verantwortlichen Gene kann aus ihren 
Aminosauresequenzen abgeleitet werden, die solchen Proteinen ahnein, 
die an der Biosynthese von D-OIIvose in anderen Organismen beteiligt 
sind. Wie fOr die Biosynthese von D-Olivose in Streptomyces 
» violaceoruber TQ22 (Granaticin-Produzent) und Streptomyces fradiae 

10 (Urdamycin-Produzent) beschrieben, beginnt die Biosynthese vom 
Glukose-1-Phosphat. das zu dTDP-D-Olivose und dTDP-2-Deoxy-D- 
Evalose durch mehrere Enzyme konvertiert wird. Ein neues Merkmal in 
diesem Stoffwechselweg ist, daB daran drei verschiedene dNDP-Hexose- 
4,6-Dehydratase-Gene beteiligt sind. Auf der Basis von 

15 Sequenzhomologien ist AviE1 eine dTDP-Glukose-4,6-Dehydratase und 
AviE3 eine GDP-Mannose-4,6-Dehydratase, was anzeigt, daB die 
Biosynthese von einigen dieser verschiedenen Zuckereinheiten aus 
verschiedenen nukleotidgebundenen Hexosepools beginnt. Auf der Basis 
der Struktur von Avilamycin A und au&erdem indiziert durch die 

20 vermeintliche Funktion von einigen Genprodukten beginnt die Biosynthese 
von D-Lyxose sogar von einem dritten Zucker-Pool, so daB es sich um ein 
Produkt des Pentose-Phosphat-Stoffwechselwegs handein konnte. Rest H 
von Avilamycin A ist ursprunglich als Methyleurekanat, abgeleitet von 2,3- 
di-0-Methylen-4,5-Dihydroxyhexansaure, beschrieben worden. Die 

25 erfindungsgemaBe Sequenzanalyse allerdings zeigt, daB Methyleurekanat 
auch das Produkt eines biosynthetischen Zuckerstoffwechselwegs ist. 
Dies alles zusammengenommen laBt aufgrund der Zahl der 
Zuckereinheiten darauf schlieBen, daB das Avilamycin-Cluster sechs 
Glykosyltransferase-Gene aufweist. Allerdings sind nur vier im 

30 erfindungsgemSBen Avilamycin-Cluster gefunden worden. Eine denkbare 
Erklarung konnte die Beteiligung von einer Oder mehr 
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Glykosyltransferasen In mehreren Syntheseschritten sein oder die 
Beteiligung von Glykosyltransferasen. die in Regionen auRerhalb dieses 
Gen-Clusters codiert werden. Drei von vier Glykosyltransferasen erinnem 
starker an Glykosyltransferasen fur die Biosynthese von 0-Antigen- 
Strukturen oder Zellwandpolysacchariden, was durch die 
polysacchariddhnliche Struktur von Avilamycin erkldrt werden kann. 



Der aw Stoffwechselweg enthdit sogar weitere interessante Merkmale: 
zwei OrthoesterbrQcken und eine MethylenbrUcke. Unter BerQcksichtigung 

10 der oxidativen Natur dieser C-O-C-Arrangements durften die a- 
Ketoglutarat-abhSngigen Oxygnasen Avid. Avi02 und Avi03 die Blldung 
dieser seltenen Bindung katalysieren. Es wird daher erfindungsgemali 
beschrieben, daR solche Enzyme molekularen Sauerstoff als direkten 
Elektronenakzeptor fur die Oxidation durch den Gebrauch von a- 

15 Ketoglutarat als Cosubstrat verwenden und hierdurch schlieBlich die C-O- 
C-Bindungen, Succinat und CO2 produzieren. Avilamycin A- 
Heptasaccharid wird durch Methylterung, durch Ankopplung von Acetat, 
Ankopplung von Dichloroisoevernins^ure und durch Ankopplung von einer 
Isobutyryleinheit modiflziert. Sechs Methyltransferase-Gene sind im 
. ^ 20 Cluster vorhanden, was der Zahl nach fur die Avilamycin-Biosynthese 
W- ausreicht, wahrend die Gene die fur die Ankopplung der ahderen Reste 

verantwortlich sind, noch nicht lokalisiert worden sind. Interessanterweise 
wurde erfindungsgemali herausgefunden, daB aviB1 und av!B2 solche 
Enzyme kodieren, die der Alpha- und der Beta-Kette von Komponenten 1 

25 der 2-Oxosauredehydrogenase-Komplexe ahnlich sind. Diese Komplexe 
werden normalen/veise aus 3 enzymatischen Einheiten zusammengesetzt. 
namlich den TPP-abhangigen Dyhydrogenasen (Heterotetramere (a2p2), 
Dihydrolipoamide-Acetyltransferasen (Homomultimere) und 

Dihydrolipoamid-Dehydrogenasen (Homodimere). Die ORFs. die fOr die 

30 letztgenannten Komponenten dieser Komplexe kodieren, sind entweder 
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noch nicht lokalisiert worden innerhalb des Clusters Oder werden fOr die 
Biosynthese von Avilamycin Qberhaut nicht gebraucht. 

Weiterliin wurde Gavibamycin A3 auf seine antibiotische Aktivitat getestet. 
5 Die ersten MIC-Versuche zeigten, da& Gavibamycin A3 etwas starl<er 
gegen verschiedene Staphylococcus aureus-Stamme als Avilamycin A 
aktiv ist. DarQber hinaus ist es etwas stdrker hydrophil als Avilymycih A. 
wie durch die Retentionsfaktoren aus der TLC und HPLC-/^alyse gezelgt 
wurde. Die nicht-chlorierten Gavibamycin-Derivate sind auch antibiotisch 
kmi 10 aktiv. 
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PatentansDriiche 



Avilamycin-Derivat gem§B allgemeiner Formel I. auch in Form 
seiner Diastereomere Oder Enantiomere bzw. razemischer Oder 
anderer Gemische oder reiner Diastereomere und/oder 
Enantiomere. 



W^^CH, B C i,, D E 




H 



^ A 



(X) 



Name of the 
compound 


Rl 


R2 


R3 


R4 


Avilamycin A 


COCH3 


OCH3 


CI 


CI 


^Avilamycin C 


CH(OH)CH3 


OCH3 


a 


a 


Gavibamycin Al 


COCH3 


OH 


a 


CI 


Gavibamycin A3 


CH(OH)CH3 


OH 


a 


CI 


Gavibamycin Bl 


COCH3 


OH 


H 


H 


Gavibamycin B3 


CH(OH)CH3 


OH 


H 


H 



. worin unabhSngig voneinander mit unten folgender Ausnahme 

Rl ausgewdhit ist aus H. COCH3. COCH2CH3. COC4H9 oder 
COCH(CH3)2. 

R2 ausgewShIt ist aus H. OHO. COCH3 oder CH(OH)CH3, 

R3 OCH3 entspricht. 

R4 CI entspricht, 

R5 CI entspricht, 

R6 CH3 entspricht, 

R7 H. CH3 Oder CH2OH entspricht, 
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und 

R8 OCH3 entspricht, 

dadurch gekennzeichnet, daQ in Bezug auf mindestens einen der 
Reste R2-R8 in Fomiel I abweichend von der voranstehenden 
Definition folgendes gilt: 

R3 ist durch OH zu ersetzen, 

R4 ist durch H zu ersetzen, 

R5 ist durch H zu ersetzen, 

R6 ist durch H zu ersetzen, 

und/oder 

R8 ist durch OH zu ersetzen, 



mit der MaBgabe, da& R1-R8 nicht gleichzeitig die Bedeutungen 
gemaB der jeweiligen Kombination in einer der Verbindungen 1 - 6 
annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


1 


COCH(CH3)2 


COCH3 


OH 


H 


CI 


CH3 


CH3 


OCH3 


2 


COCH(CH3)2 


COCH3 


OCH3 


CI 


H 


CH3 


CH3 


OCH3 


3 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


H 


CH3 


OCH3 


4 


COCH(CH3)2 


COCH3 


OCH3 


CI 


CI 


CH3 


CH3 


OH 
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2. Avilamycin-Derivat gemaB Anspruch 1, dadurch gekennzelchnet, 
dad mindestens R3 durch OH zu ersetzen ist. mit der Ma&gabe, 
da& R1-R8 nicht gleichzeitig die Bedeutungen gemdB der 
Kombination in der Verbindung 1 annelimen kdnnen: 



5 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


1 


COCH(CH3)2 


COCH3 


OH 


H 


01 


CH3 


OH3 


OCH3 



Avilamycin-Derivat gemaS einem der AnsprQche 1 oder 2, dadurch 
gekennzeichnet, dad mindestens R4 und R5 in Fomriel I durch H zu 
ersetzen sind. 

Avilamycin-Derivat gemaU einem der AnsprQche 1 bis 3, dadurch 
gekennzeichnet. dad mindestens R3 durch OH. R4 und R5 durch H 
zu ersetzen sind. 

Avilamycin-Derivat gemaB allgemeiner Formel I, auch in Form 
seiner Diastereomere oder Enantiomere bzw. razemischer oder 
anderer Gemische oder reiner Diastereomere und/oder 
Enantiomere, ausgewdhit aus Verbindungen, in denen R1-R8 
jeweils wie folgt kombiniert sind: 



R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH2CH3 


H 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH3 


COCH3 


OH 


CI 


CI 


CH3 


CH3 


OCH3 


COCH(CH3)2 


CH(OH)CH3 


OH 


CI 


CI 


CH3 


CH3 
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6. Avilamycin-Derivat. dadurch erhaltlich, dad in einer kultivierbaren 
Zelle, die die nOtigen Gene bzw. Enzyme zur Synthese eines 
5 Orthosomycin-Gaindi^drpers bestehend aus 

einem endstandigen Dichloroisoeverninsaure-Rest (A in. 
Fomiel I) und 

einem damit veresterten, uber noimale Esterbindung uhd 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 
in Formel I) aus: 

(i) zwei D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose (E), 

(iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) und 




(b) 
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(vi)einem (Methyl-)Eurekanat Rest (H) 

aufweist, mindestens eine Nukleinsaure, deren Sequenz zu 
mindestens 95%, vorzugsweise 97%. insbesondere genau, der 
Nukleinsauresequenz gemaB einer Sequenzen mit den laufenden 
Nr. 1 bis 54 (gemSS Tabelle 1 i.V.m. Abb. 1) entspricht. 
gentechnologisch verSndert, deletiert oder nicht exprimiert wird, die 
so modifizierte Zelle kultiviert wird, der Kulturuberstand gewonnen 
und aufgearbeitet wird, das oder die Avilamycin-Derivat/e 
aufgereinigt und isoliert wird und gegebenenfalls verschiedene 
Derivate getrennt werden, 



mit der Madgabe, da& R1-R8 nicht gleichzeitig die Bedeutungen 
gemaB der jeweiligen Kombination in einer der Verbindungen 1-16 
annehmen konnen: 
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Avilamycin-Derivat gem§a Anspruch 6, dadurch gekennzeichnet, 
da& die kultivierbare Zelle ausgewahit ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes Oder einer Zelle, die mit 
Ausnahme der gentechnologisch verdnderten, deletierten oder nicht 
exprimierten Nukleins3ure/n die NukleinsSuren gemSH einer 
Sequenz einer der laufenden Nr. 1-54 (gemdB Tabelle 1 i.V.m. Abb. 
1) bzw. dazu zu mindestens 95%, vorzugsweise 97 %, homologe 
Nukleinsauren enthait oder das Gencluster gemaB Abb. 109 
enthait, vorzugsweise ausgewahit ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes, insbesondere einer Zelle vom 
Typ Streptomyces viridochromogenes TO 57. 

Avilamycin-Derivat gemSd einem der Anspruche 6 oder 7, dadurch 
gekennzeichnet, da& die verdnderte/n Nukleins3ure/n for eine 
Methyltransferase und/oder fur eine Halogenase kodierte/n. 

Avilamycin-Derivat gemdfi Anspruch 8, dadurch gekennzeichnet. 
da& . die Sequenz der veranderte/n NukleinsSure/n vor der 
Veranderung zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der NukleinsSuresequenz einer der 
Sequenzen mit laufender Nr. 1 , 2-7 oder 48-49 (gemaS Tabelle 1 
i.V.m. Abb. 1), vorzugsweise einer der Sequenzen mit laufender Nr. 
1 Oder 2-7 (Tabelle 1 i.V.m. Abb. 1), insbesondere einer der 
Sequenzen mit laufender Nr. 1 und/oder 2 (gemau Tabelle 1 i.V.m. 
Abb. 1), entspricht. 

Avilamycin-Derivat gemd& einem der AnsprOche 6 bis 9, dadurch 
gekennzeichnet. daC die Veranderung der NukleinsSure/n dazu 
fuhrt, daS das oder die durch die gentechnolgisch verSnderte/n 
Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
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gentechnologischen VerSnderung nicht mehr synthetisiert 
wird/werden. 

Avilamycin-Derivat, gemd& einem der AnsprQche 1 bis 4. 5 Oder 6 
bis 10, dadurcli gelcennzeichnet, dafi es hydropliiler ist als 
Avilamycin A Oder C bzw. Eveminomycin (Ziracin). 

Nukleinsaure in ihrer Sequenz zu mindestens 95%, vorzugsweise 
97%, insbesondere genau. entsprechend der Nukleinsauresequenz 
gemau einer der Sequenzen mit lalifender Nr. 1 bis 51 (gemsa 
Tabelle 1 i.V.m. Abb. 1). 

Nuldeinsaure gem3& Ansprucli 12, dadurch gelcennzeichnet, da& 
die Nuldeinsdure zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der NuldeinsSuresequenz gemd& einer der 
Sequenzen mit laufender Nr. 1 bis 32 und 48 bis 51 (gem3& Tabelle 
1 i.V.m. Abb. 1), vorzugsweise 1 bis 7, insbesondere 1 oder 2, 
entspricht. 

Gencluster entiialtend „Open reading frames", vorzugsweise 54, die 
in ihrer Nukleinsauresequenz zu mindestens 95%, vorzugsweise 
97%, insbesondere genau, den NukleinsSuresequenzen gema& 
den Sequenzen mit laufender Nr. 1 bis 54 (gemaB Tabelle 1 i.V.m. 
Abb. 1) entsprechen und die auf einemi NukleinsSurestrang 
angeordnet sind. vorzugsweise gema& Abb. 109. 

Protein oder Polypeptid In seiner AminosSuresequenz zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, 
entsprechend der Aminosauresequenz gemdG einer der 
Sequenzen mit laufender Nr. 55 - 104 (gemali Tabelle 1 i.V.m. 
Abb. 1). 
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Protein Oder Polypeptid gemaB Anspruch 15, dadurch 
gekennzeichnet, daB das Protein oder Polypeptid zu mindestens 
95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaB einer der Sequenzen mit laufender 
Nr. 55 bis 86 (gemaB Tabelle 1 i.V.m. Abb. 1), vorzugsweise 55 bis 
61, insbesondere 55 oder 56, entspricht. 

Protein oder Polypeptid kodiert durch eine Nukleinsaure gemaB 
einem der Anspruche 12 oder 13. 

Gentechnologisch veranderte Zelle enthaltend mindestens eine 
nicht endogene Nukleinsaure gemaB einem der AnsprUche 12 oder 
13, einen nicht-endogenen Gencluster gema& Anspruch 14 
und/oder ein nicht-endogenes Protein oder Polypeptid gemaH 
einem der AnsprUche 15-17. 

Zelle enthaltend mindestens eine gentechnologisch veranderte 
Nukleinsaure, deren Sequenz vor der Verdnderung zu mindestens 
95%. vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaR einer der Sequenzen mit laufender 
Nr. 1 bis 54 (gemaS Tabelle 1 i.V.m. Abb. 1) entsprach. 

Zelle vom Typ Streptomyces viridochromogenes, vorzugsweise 
vom Subtyp 7057, dadurch gekennzeichnet, dad mindestens eine 
der Nukleinsauren mit einer Sequenz gemaH einer der Sequenzen 
mit laufender Nr. 1-54 (gemSB Tabelle 1 i.V.m. Abb. 1) 
gentechnologisch verandert oder deletiert wurde. 

Zellen gemaB Anspruch 20, dadurch gekennzeichnet, daB 
mindestens eine der Nukleinsauren mit einer Sequenz gemaB einer 
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der Sequenzen mit laufender Nr. 1, 2-7 Oder 48-49 (gemMB Tabelle 

1 i.V.m. Abb. 1), vorzugsweise 1 oder 2-7, insbesondere 1 und/oder 

2 gentechnologisch verdndert oder deletiert wurde. 

Verwendung einer Nukleinsdure gemd& einem der AnsprQche 12 
Oder 13, eines Genclusters gerndd Anspruch 14, eines Proteins 
Oder Polypeptids gemad einem der AnsprOche 15 bis 17 und/oder 
einer Zelle gemdG einem der AnsprQche 18 bis 21 zur Herstellung 
eines Aviiamycln-Derivats, vorzugsweise gema& einem der 
Anspruche 1 bis 1 1 . 

Verfahren zur Herstellung von Avilamycin-Derivaten gemaB einem 
der AnsprQche 1 bis 5 gekennzeichnet durch folgende Schritte: 

(1) in einer kuitjvierbaren Zelle. die die n6tigen Gene bzw. Enzyme 
zur Synthese des Orthosomycin-GrundkOrpers bestehend aus 

(a) einem endstdndigen Dichloroisoeverninsdure-Rest (A in 
Formel I) und 

(b) einem damit veresterten, Uber normale Esterbindung und 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 
in Formel I) aus: 

(i) zwel D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose (E), 

(iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) unci 

(vi) einem (Methyl-)Eurekanat Rest (H) 
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aufweist, wird mindestens eine Nukleinsaure. deren Sequenz 
zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
der Nukleinsauresequenz gemd& einer der Sequenzen mit 
laufenden Nr. 1 bis 54 (gemaB Tabelle 1 I.V.m. Abb. 1) 
entspricht, gentechnologisch verdndert. deletiert oder nicht 
exprimiert, 

(2) die so gentechnologisch veranderte Zelle wird kultiviert. 

(3) der Kulturuberstand wird gewonnen, 

(4) der KulturQberstand wird aufgearbeitet und dabei das Oder die 
entstandene/n Avilamycin-Derivat/e aufgereinigt und isoliert, 

(5) gegebenenfalis werden unterschiedliche Derivate getrennt. 

Verfahren gem3& Anspruch 23, dadurch gekennzeichnet, daC die 
kultivierbare Zelle ausgewahit ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes oder einer Zelle, die mit 
Ausnahme der gentechnologisch verdnderten, deletierten oder nicht 
exprimierten NukleinsSure die NukleinsSuren gemaH einer Sequenz 
mit laufender Nr. 1-54 (gemSB Tabelle 1 i.V.m. Abb. 1) bzw. dazu 
zu mindestens 95%, vorzugsweise 97 %, homologe NukleinsSuren 
enthait Oder den Gencluster gemaU Anspruch 14 enthalt, 
vorzugsweise ausgewahit ist aus einer Zelle vom Typ Streptomyces 
viridochromogenes, insbesondere einer Zelle vom Typ 
Streptomyces viridochromogenes TO 57, 

Verfahren gemaB einem der AnsprQche 23 oder 24, dadurch 
gekennzeichnet. daB die veranderte/n Nukleinsdure/n fOr eine 
Methyltransferase und/oderfur eine Halogenase kodiert/en. 

Verfahren gemaB Anspruch 25, dadurch gekennzeichnet, daS die 
Sequenz der veranderte/n Nukleinsaure/n vor der VerSnderung zu 
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mindesfens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz einer der Sequenzen mit laufender Nr. 1, 2-7 
Oder 48-49 (gemaB Tabelle 1 i.V.m. Abb. 1), vorzugsweise einer 
der Sequenzen mit laufender Nr. 1 oder 2-7 (gemaU Tabelle 1 
i.V.m. Abb. 1), insbesondere einer der Sequenzen mit laufender Nr. 
1 und/oder 2, entsprach. 

Verfahren gemsa einem der Anspruche 23 bis 26, dadurch 
gekennzeichnet, da& die VerSnderung der Nukleinsaure/n dazu 
fuhrt, daB das oder die durch die gentechnolgisch veranderte/n 
Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
gentechnologischen Veranderung nicht mehr synthetisiert 
wird/werden. 

Arzneimittel enthaltend Avilamycin-Derivate gemd& einem der 
Anspruche 1 bis 11 sowie gegebenenfalls geeignete Zusatz- 
und/oder Hilfsstoffe. 

Verwendung eines Avilamycin-Drivats gemdB einem der AnsprQche 
1 bis 11 zur Herstellung eines Arzneimittels mit antibiotischer 
Wirkung zur Behandlung bzw. zur Herstellung eines Arzneimittels 
zur Behandlung von Erkrankungen, bspw. Infektionskrankheiten. 
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Zusammenfassunq 

Die Erfindung betrifft Avilamycin-Derivate, gentechnologische 
biosynthetische Verfahren zu deren Herstellung, Arzneimittel enthaltend 
diese Verbindungen, sowie die Verwendung dieser Verbindungen zur 
Herstellung eines Arzneimittels gegen Infektionskrankheiten wie auch 
Nucleinsauren, Proteine und Gencluster und entsprechende Zellen, die 
mit der Herstellung dieser Avilamycin-Derivate verbunden sind. 



Sequenz des Avilamycin- 
Biosynthesegenclusters 
(Genstarts sind besonders 
gekennzeichnet) 



File.: I' .Av.i.rooo:DNA ''^^ • ' v' . . - 

Range : , , 1 - 59816 Mode : Normal + Complementary 

Codon Table : Universal 

DVMRVAAFTSLLQISVSA 
IWWGYPPSRRCFSSRCP R 
SGGDTRR.RVDVSAPDVRV 

3' CCT AGG TGG TAG GCA TGC CGC CGC TTG GAG CTG TOT TCG AGO TAG CTG TGC CTG 
9 18 27 36 45 54 

5' GGA TGC ACC ATC CGT ACG GCG GCG AAC GTC GAG AGA AGC TGG ATC GAG AGG GAG 

GST IR TAANV DR S W I D TD 
DPPSVRRRTSTEAGST RT 
IHHPYGGERRQKLDRHGR 

RANNLSRRPPRGTVTTLS 
ARTT*RGGRRGGPSPP*R 

RARQEAVAEAAERHRHDV 

GGC GCG CGC AAC AAG TCG CTG GCG GAG GCG GCG GAG GGC CAC TGC GAG CAG TTG 
63 72 81 90 99 108 

^._GCG CGC GCG TTG TTC AGC GAC CGC CTG GGC GGC GTC GCG GTG ACG GTG GTC AAC 

|fer 

ARALFSDR LGGLPVTVVN 
R A R C S A T A S AA .S R * R W S T 
ARVVQRP PRRPPGDGGQR 

ASAAPTAS ICKPAPRSRR 

RPRPRRRRSASRRPGRGG 
V R V.R G A D G L H V E A R A A V A 

CTG CGC CTG CGC CGG CCG CAG CGG CTG TAG GTG AAG CCG CGC CCG GCG CTG GCG 
117 126 135 144 153 162 

GAC GCG GAC GCG GCG GGC GTC GCG GAG ATG CAC TTC GGC GCG GGC CGC GAC CGC 

DADAA GVAEMHFGAGRDR 
TRTR P ASPRCTSARAATA 
RG RGRRRRDALRRGPRPP 



s - 



iHl PVTIRRVR PVPMPLASNM 

P G R S G G * . G R, C P C R G R_ A T * 
P A G H D E E G E A RA D A A R Q E 

GCG CCG TGG CAC TAG GAG GAG TGG GAG CCG TGC CCG TAG CCG TCG CGC GAC AAG 
171 180 189 198 207 216 

CGG GGC ACC GTG ATC GTC CTG ACC CTG GGC ACG GGC ATC GGC AGC GCG CTG TTC 

RGTVILLTLGTGIGSALF 
GAP *SS SPSARA SAARCS 
GHRDPPHPRHGHRQRAVH 

SPARTGLVSSPWRSSW PW 
RRRGPGWCPAPGG RVGHG 
DVAGQDGVRLQAVEFEMA 



TAG CTG CCG CGG GAC CAG GGG TTG TGC GTC GAC CCG GTG GAG CTT GAG GTA CCG 



225^" . 234*^ • 243-- - 252''^^ ' 26^1 ' 270 

ATC GAC GGC GCC CTG GTC CCC AAC ACG GAG CTG GGC CAC CTC GAA CTC CAT GGC 



IDGALVPNTELGHLELHG 
STAPWSPTRSWATSNSMA 
RRRPGPQHGAGPPRTPWP 

SASFRAELLALSSS SSLQ 
H RRSARRWCPWPPRPASS 
MVGLLAGGALGPLVLLQA 



GTA CTG CGG CTC TTC GCG CGG AGG TCG TTC CGG TCC CTC CTG CTC CTC GAC TCG 
279 288 297 306 31 5 324 

CAT GAC GCC GAG AAG CGC GCC TCC AGC AAG GCC AGG GAG GAC GAG GAG CTG AGC 



HDAEKRASSKAREDEELS 
MTPRS AP PARPGRTRS *A 
*RREARLQQGQGGRGAEL 

S CQARR TWFYRAWT S I S N 
PASPG GRGSTGRGHRSAT 
PLVPGAADLLVE GMDLHQ 



^\CC CTC GTG ACC CGG GCG GCG CAG GTC TTC ATG GAG CGG GTA CAG CTC TAC GAC 
333 342 351 360 369 378 

TGG GAG CAC TGG GCC CGC CGC GTC CAG AAG TAC. CTC GCC CAT GTC GAG ATG CTG 



WEHWARRVQKY LAHVEM L 
GSTGPAASRSTSPMSRCC 
G ALGPPRPEVPRPCRDAV 

EGSSNMMPPPTLRLDWLN 
RGPAT* *RRRPSGCT GCT 
EGRLQEDDAAPHAAL GV. L 



AAG AGG GGC CTC GAC AAG TAG TAG CCG CCG CCC CAC TCG GCG TTC AGG GTG TTC 
387 396 405 414 423 432 

TTC TCC CCG GAG CTG TTC ATC ATC GGC GGC GGG GTG AGC CGC AAG TCC CAC AAG 

"'"^Wf SPELFI IGGGVSRKSHK 
'^'^^ SPRS CSSSAAG*AASPTS 
L ~P . G A V H' H R R R G E P Q V P Q V 

RCRMSPMLASITGAWSCF 
GAG*RPC*PPSRGPGAAS 
EQVED LADLRLD D -RGL QL 



AAG GAC GTG GAG TAG CTC CCG TAG TTC CGC CTC TAG CAG GGC CGG GTC GAC GTC 
441 450 459 468 477 486 

TTC CTG CAC CTC ATC GAG GGC ATC AAG GCG GAG ATG GTC CCG GCC CAG CTG CAG 



FLHLIEGIKAEIVPAQLQ 
SCTS SRASRRRSSRPSCR 
PAPHRGHQGGDRPGPAAE 

LAPITPAAIRAA SFSP*A 
CRRSRRPPSA PPPSPRSP 

-2. 



V* V G p* - D- D P* R' HV P R* R ^ L' ' X" V A L 



TTG TTG CGG CCC TAG CAG CCC CGC CGC TAG GCC CGC CGC CTC TTC CTG COG ATC 
495 504 513 522 531 540 

AAC AAC GCC GGG ATC GTC GGG GCG GCG ATG CGG GCG GCG GAG AAG GAG GGC TAG 

NNAGIVGAAMRAAEKDG* 
TTP GSS GRRCGRRRRT AR 
QRRDRRGGDAGGGEGRLG 

GRRRPS GSSLAQRRDGPG 
GAVGPHDLRCPRA ATVQV 
GRSAPT I WVVPG P PP.* RS 

CGG GGC GCT GCG GCC CCA CTA GGT CTG CTG TCC CGG ACC GCC GCC AGT GGA CCT 
549 558 567 576 585 594 

GCC CCG CGA CGC CGG GGT GAT CCA GAC GAC AGG GCC TGG CGG CGG TCA CCT GGA 

APRRRGDPDDRA WRRS PG 
PRDAGV IQTTGPGGGHLD 
PATPG* SRRQGLAAVTWT 

^jfc) AAPRPGAPWC GS RGHP * S 
^'^P PPGRGQPGAAPDETRDR 
RRRAAARRALLRI KRATV 

GGC CGC CGC CCG GCG CCG GGA CGC CCG GTC GTC GGC CTA GAA GGC ACG CCA GTG 
603 612 621 630 639 648 

CCG GCG GCG GGC CGC GGC CCT GCG GGC CAG CAG CCG GAT CTT CCG TGC GGT CAC 

PAAGRGPAGQQPDLPC GH 
RRRAAALR ASSRI FRAVT 
GGGPRPCGPAAGSSVRSR 

SVPS*RGETCGGPRPPSP 
HSRRDADRRVAVRGPHRP 
I LGA IL TGGYLWGA QT AL 



CTA CTC TGG CCG CTA GTC GCA GGG AGG CAT GTC GGT GGG CCG GAC CCA CCG CTC 
J- 657 666 675 684 693 702 

^"^JAT GAG ACC GGC GAT CAG CGT CCC TCC GTA CAG CCA CCC GGC CTG GGT GGC GAG 

DE TGDQRPSVQPPGLGGE 
MRPA I S VPPYS HPAWVAR 
*DRRSASLRTATRP.GWRG 

PSSGW* TDASGGAATP WR 
RHLAGDPTRRDGRRQRGG 
ATFLGMLHGGIG.GGSDAV 

CCG CCA CTT CTC GGG GTA GTC CAC AGG CGG CTA GGG GGG CGG CGA CAG CCG GTG 
711 720 729 738 747 756 

GGC GGT GAA GAG CCC CAT CAG GTG TCC GCC GAT CCC CCC GCC GCT GTC GGC CAC 

GGEEPHQVSADPPAAVGH 
AVKSPIRCPPIPP PLSA T 
R*RAP S GVRRSPRRCRPP 
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CWGWPSPSRYWWRRPRWT 
AGAGRRLRDTGGGARDGP 
PVLGVAFAIPVVVPATAL 



GCC GTG GTC GGG GTG CCG CTT CCG CTA GCC ATG GTG GTG GCC GCG CCA GCG GTC 
765 774 783 792 801 810 

CGG CAC CAG CCC CAC GGC GAA GGC GAT CGG TAG CAC CAC CGG CGC GGT CGC CAG 

R .HQPHGEGDR YHHRRGRQ 
GTSPTA KAIGTTTGAVAR 
APAPRRRRSVPPPARSPG 

AGACGCRR*SACPCSCCA 
RGQAGVGGDPRVRAPVAR 
DG RRVWVATLVCVPLFLV 

CAG CGG GGA CGC GTG GGT GTG GCG GCA GTC CTG CGT GTG CCC GTC CTT GTC GTG 
819 828 837 846 855 864 

GTC GCC CCT GCG CAC CCA CAC CGC CGT CAG GAG GCA CAC GGG CAG GAA CAG CAC 



VAPAHPHRRQDAHGQEQH 



-^xSPLRTHTAVRTHTGRNST 
r^RPCAPT PPSGRTRA GTAR 

TCRSRRG SCCRTST ASCS 
Q VAHAVVRV AALRP L RAP 
SYLTLSSGFLLS D LYGLL 

CGA CAT GTC GCA CTC GCT GCT GGG CTT GTC GTC GCT CAG CTC CAT CGG CTC GTC 
873 882 891 900 909 918 

GCT GTA CAG CGT GAG CGA CGA CCC GAA CAG CAG CGA GTC GAG GTA GCC GAG CAG 

AVQRERRPEQQRVEVAE Q 
LYSVSD DPNSSESR*PS R 
CTA*ATTRT AASRGSR AG 

C *PAASCAAAWGP*GPTP 
ADRRRLVPRRGARDAPP Q 

MVAGCFLGGGLGTLRPN 

— — — — 

CTC GTA GTG CCG CGG CGT CTT GTC CGG CGG CGG GTC GGG CCA GTC GGC CCC CAA 
927 936 945 954 963 972 

GAG CAT CAC GGC GCC GCA GAA CAG GCC GCC GCC CAG CCC GGT CAG CCG GGG GTT 

EH H GAAEQAAAQPGQ P GV 
SITAPQNRPPPSPVSRGL 
ASRRRRTGRRPARSAGGW 

FGACPRPRPPR GPAGYRR 
SVPAPGPG RPAARPATGG 
PFRRLAQAAPPPGPRRVA 

CCC TTT GGC CGC GTC CCG GAC CCG GCG CCC CCC GCC GGG CCC CGC GGC ATG GCG 
981 990 999 1008 1017 1026 

GGG AAA CCG GCG CAG GGC CTG GGC CGC GGG GGG CGG CCC GGG GCG CCG TAG CGC 



G""'^ K" - F \ A Q G X • • G" R * G G R*' P " G V " A' P - Y R 
GNRRRAWAAGGGPGRRTA 
ETG AGPGPRGAARGAVPP 

PRRP .RVPRVLAASP SPGP 
RAVPGCPGYWPPAPPRAP 
APSPAARATGPRRQPVPR 

GCG CCC GCT GCC CCG GCG TGC CCG GCA TGG TCC CGC CGC GAG CCC CTG CCC GGC 
1035 1044 1053 1062 1071 1080 

CGC GGG C6A CGG GGC CGC ACG GGC CGT ACC AGG GCG GCG CTG GGG GAC GGG CCG 

RGRRGRTGRTRAALGDGP 
A GD GAAR A VPGRR W G T GR 
RATGPHGPYQGGAGGRAG 

PAPPGPRSPPGPPGPPGA 
HLPRAPV. APRAQLVPRAL 
T SRAPRSPQAPRSSRAPW 

CCA CCT CGC CCG CCC GGC CCT GCC GAC CCG CCC GGA CCT CCT GGC CCQ CCC GGT 
1089 1098 1107 1116 1125 1134 

T GGA GCG GGC GGG CCG GGA CGG CTG GGC GGG CCT GGA GGA CCG GGC GGG CCA 



GGAGGPGRLGGPGGPGGP 
VE RAGRDGWA. GLEDRAGQ 
W SGRAGTAGRAWRTGRAS 

T GA R V A GA A R S VA T AA R R 

RGP GSRERRARFRRRRAG 
GDRGPGSGGRAFGGDGRA 

CGG CAG GGC CGG GCC TGG CGA GGG CGG CGC GCG CTT TGG CGG CAG CGG CGC GCG 
1143 1152 1161 1170 1179 1188 

GCC GTC CCG GCC CGG ACC GCT CCC GCC GCG CGC GAA ACC GCC GTC GCC GCG CGC 

AV P A R T A P AARE T A V A A R 
PSRPGPLPPRAKPP SPRA 
RPG PDRSRRARNRRRRAP 

US 

VAGAQFSDAGAE SCVTKV 
C R E R R S" H T R E R R A A Y R R * 
AGSGGPI LGSGGRQMGDE 

GCG TGG CGA GGG CGG ACC TTA CTC AGG CGA GGG CGG AGC GAC GTA TGG CAG AAG 
1197 1206 1215 1224 1233 1242 

cgc acc gct ccc gcc tgg aat gag tcc gct ccc gcc tcg ctg cat acc gtc ttc 

rtap awn e sapa. s l h t v f 
apl ppgmsplpp rc i pss 
hrsrle*vrsrlaayrlh 

ggr vaagaalsvg.gvgrr 
gagcrrgrrsrcgawgag 
grgagggggravgrggra 



TGG GGC GGG GCG TGG CGG CGG GGG CGG CGC TCG CTG TGG GGC GGG TGG GGC GCG 



125n ' V2G0: 1269-^ ' 1278 ' ' * VZ&T ' 1296 

ACC CCG CCC CGC ACC GCC GCC CCC GCC GCG AGC GAG ACC CCG CCC AGO CCG CGC 



TPPRTAAPAASDTPPTPR 
PRPAP PPPP RATPRPPRA 
PAPHRRPRRERHPAHPAP 

RRRCRRRRLTDRKTGPLD 
GAVAVADAYRTASRVRCT 
AQSPLPTPTAHRAEYGAP 



GCG GAG GCT GCC GTT GCC GCA GCC GCA TCG CAC AGC GCG AAG CAT GGG CCG TCC 
1305 1314 1323 1332 1341 1350 

CGC CTG CGA CGG CAA CGG CGT CGG CGT AGC GTG TCG CGC TTC GTA CCC GGC AGG 



RLRRQRRRRS VSR FVPGR 
ACDGNGVGVA CRASYPAG 
PA T A TA S A * RVA L R T R Q V 

RGTHSWQVLKPRS IHR IA 
ADQTAGSSWSLDA^TGF R 
RTRHPEVPGV *TPKHASD 



^GC GCA GGA CAC ACC GAG GTG ACC TGG TTG AAT CCA GCC GAA TAG ACG GCT TAG 
1359 1368 1377 1386 1395 1404 

TCG CGT CCT GTG TGG CTC CAC TGG ACC AAC TTA GGT CGG CTT ATG TGC CGA ATC 



SRPVW LHWTNLGR L MCRI 
RVL CGS TGPT -*VG L CAE S 
ASCVAPLDQ LRSAYVPNR 

W*VR RPASRPWTNSVAGP 
GD S V GH P P G .QGH T R Y P V P 
GM LCATPRVKAMHE I R CR 



CGG GTA GTC TGT GCG GCA CCC CGC CTG GAA CCG GTA CAC AAG CTA TGC CGT GGC 
1413 1422 1431 1440 1449 1458 

GCC CAT CAG ACA CGC CGT GGG GCG GAG CTT GGC CAT GTG TTC GAT ACG GCA CCG 

dm^h HQTRRGADLGHVFDTAP 
PI RHAVGRTLAMC S I R HR 
P S D T P W G G P W P C V R Y G T G 

GPGARRLSTSRGTRRC*R 
APDPVG YVPPDARADADD 
PRTRCATSQHIPGHTQMM 

CCC GGC CCA GGC CGT GCG GCA TCT GAG CAC CTA GCC GGG CAC GCA GAG GTA GTA 
1467 1476 1485 . 1494 1503 1512 

GGG CCG GGT CCG GCA CGC CGT AGA CTG GTG GAT CGG CCC GTG CGT CTG CAT CAT 



GPGPARRRLVDRPVRLHH 
GRVRHAVDWWIGPCV CI I 
AG SGTP*TGGSAR.ASAS S 

CRLDFFSRAGAWGARFDE 
AGFI SSPGPGLGALGSTR 



Q- V s ' S-* R ■ - r;* IS" ^ ^ g ** w' *C3^ * ' x^^ w ij' q l g 



GAC GTG GCT TCT AGC TTC TTC CTG GCC CGG GGT CGG GTC GGT CGG GAC TTC AGG 
1521 1530 1539 1548 1557 1566 

CTG CAC CGA AGA TCG AAG AAG GAC CGG GCC CCA GCC CAG CCA GCC CTG AAG TCC 

LHRRSKKDRAPAQPALKS 
CTEDRRRTGPQPSQP *SP 
APKIEEGPG PSPASPEVL 

*TRSTA VHRERDSDDTQR 
ERVPLRLTDSVIPITPRG 
RV.YPFDCRTA*SRFRRDA 

AGA GTG CAT GCC CTT CAG CGT TGC ACA. GCG AGT GCT AGC CTT AGC AGC CAG ACG 
1575 1584 1593 1602 161 1 1620 

TCT CAC GTA CGG GAA GTC GCA ACG TGT CGC TCA CGA TCG GAA TCG TCG GTC TGC 

SHVREVATCRSRS ES SVC 
L T Y G K S Q R^ VAHDRNRRSA ^/| 



N 0 



S L T I G I 
=> 



IDALRGQEVGQGLVVHQ R 
'^|P>^ FT PLDVRNLARVLFSTSA 
SHRCT S GT * RGS W S R RAP 

GCT TAC AGC CGT TCA GCT GGG ACA AGT TGC GGG ACT GGT TCT TGC TGC ACG ACC 
1629 1638 1647 1656 1665 1674 

CGA ATG TCG GCA AGT CGA CCC TGT TCA ACG CCC TGA CCA AGA ACG ACG TGC TGG 

RMSASRPCSTP-*PRTTCW 
ECRQVDPVQRPDQE RRAG 
NVGKS TLFNALTKNDVLA 

GVVREGRDLGVDTDHADG 
AL*GNAV ISGLTPTTPTG 
PWSGTRWSRAWRRHRPRG 

GCC GGT TGA TGG GCA AGC GGT GCT AGC TCG GGT TGC AGC CAC AGC ACC CGC AGG 
(j^- 1683 1692 1701. 1710 1719 1728 

"^GG CCA ACT ACC CGT TCG CCA CGA TCG AGC CCA ACG TCG GTG TCG TGG GCG TCC 

R PTTRSPRSSPTSVSWAS 
GQLPVRHDRAQRRCRGRP 
ANYPF ATIEPNVGVVGVP 

VCAEGLQGLDEGG LADER 
SARRVLNASIKEEWRMRG 
RRVG * W T P R SRR R GA C GG 

GGC TGC GTG CGG AGT GGT TCA ACC GGC TCT AGA AGA GGA GGG TCG CGT AGG AGG 
1737 1746 1755 1764 1773 1782 

CCG ACG CAC GCC TCA CCA AGT TGG CCG AGA TCT TCT CCT CCC AGC GCA TCC TCC 

PTHASPSWPRSSPPSASS 
RRTPHQVGRDLLLPAHPP 
DARLTKLAEIFSSQRILP 
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RGDVEDVDGADHAAGGLP 
AV TSKT SMAPMTRPAE SP 
PSRRSR RCRRCRARRRRP 



GCC GCT GGC AGC TGA AGC AGC TGT AGO GGC CGT AGC ACG CGC CGC GGA GGC TCC 
1791 1800 1809 1818 1827 1836 

CGG CGA CCG TCG ACT TCG TCG ACA TCG CCG GCA TCG TGC GCG GCG CCT CCG AGG 



RRPSTSSTSPASCAAPPR 
GDRRLR RHRRHRARRLRG 
ATVDFVDIAGIVRGASEG 

LAQAVLEERVDTLGVRDA 
SPRPLLNRAFMRSDSAIQ 
PPG PCCTGRSCGHTRRSR 

CGC TCC CGG ACC CGT TGT TCA AGG AGC GCT TGT AGG CAC TCA GGC TGC GCT AGA 
1845 1854 1863 1872 1881 1890 

GGG AGG GCC TGG GCA ACA AGT TCC TCG CGA ACA TCC GTG AGT CCG ACG CGA TCT 



G R A W A T S S S R T S V S P T R S 
GPGQQVPREHP*VRRDL 
EGLGNKFLANIRESDAI C 

LDDAGE LVLVDDM DVALb 
WTMRAKLSSFTTWT SPL T 
G P * G R R * P R S R R G H R R C P 



CGG TCC AGT AGG CGC GGA AGT TCC TGC TCT TGC AGC AGG TAC AGC TGC CGT TCC 
1899 1908 1917 1926 1935 1944 

GCC AGG TCA TCC GCG CCT TCA AGG ACG AGA ACG TCG TCC ATG TCG ACG GCA AGG 

ARSSAP SRTRTS SMS TAR 
P GHP R L Q GRERR P C R R Q G 
QVIR AFKDENVVHVDGKV 



R GLVVDLRDVGLQDERVE 




AGA GCG GGT TCC TGC TGT AGC TCT GCT AGT TGT GGC TCG ACT AGG AGC GCC TGG 
1953 1962 1971 1980 1989 1998 

TCT CGC CCA AGG ACG ACA TCG AGA CGA TCA ACA CCG AGC TGA TCC TCG CGG ACC 



SRPRTTSRRSTPS*SSRT 
LAQGRHRDDQHRADPRGP 
SPKDD I ETINTELI LADL 

LRDLLDQGAEL LVRPDLL 
WVISFTRGRRWFSERILF 
G S SR S P GAGGGS P S.A S * S 



AGG TCT GCT AGC TCT TCC AGG ACG GGG CGG AGG TCT TCC TGA GCG CCT AGT TCT 
2007 2016 2025 2034 2043 2052 

TCC AGA CGA TCG AGA AGG TCC TGC CCC GCC TCC AGA AGG ACT CGC GGA TCA AGA 
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PDDREGPAPPPEGLADQE 
Q TI EKV LPR LQKD SR I KK 

VERRLHLGDLLGLLDQ LP 
SRAGFT FAT S SAL S I R S L 
PGR A SP S PRR PPWP S G P S 



TCC TGG AGC GCG GCT TCC ACT TCC GGC AGC TCC TCC GGT TCC TCT AGG ACC TCT 
2061 2070 2079 2088 2097 2106 

AGG ACC TCG CGC CGA AGG TGA AGG CCG TCG AGG AGG CCA AGG AGA TCC TGG AGA 



RTSRRR*RPSRRPRRSWR 
GPRAEGEGRRGGQGDPGE 
DLAPKVKAVEEAKEI LER 

AVGEEGVADDLAGLAVLE 
PSVRKAWPMTWPVSRLSS 
PR CGRRGRCRGPCRACRA 



CCC CGC TGT GGG AGA AGC GGG TGC CGT AGC AGG TCC CGT GGC TCG CGT TGC TCG 
2115 2124 2133 2142 2151 2160 

'/>^.GG GCG ACA CCC TCT TCG CCC ACG GCA TCG TCC AGG GCA CCG AGC GCA ACG AGC 

'^r>-- — 

GATPSSPTASSRAPSATS 
GRHPLR PRHRPGHRAQR A 
GDTLFAHGIVQGTERNEL 

QVVQVQEGGLGEE VDEVD 
RCSRCR SVVLGKR * T K L T 
GARGAGA *WWARGR.RR * R 



AGG ACG TGC TGG ACG TGG ACG AGT GGT GGT TCG GGA AGG AGA TGG AGA AGT TGC 
2169 2178 2187 2196 2205 2214 

TCC TGC ACG ACC TGC ACC TGC TCA CCA CCA AGC CCT TCC TCT ACG TCT TCA ACG 



SCTTCTCSPPSPSSTS ST 



P A R .P A P A H H Q A L P L R L .Q R 




S S S S S I S S S K L F S C R A R T 
RRPRASRRPS *S RAARGP 



AGC TGC TCC TGC TCG ACT AGC TGC TCC TGA AGT TCT TGC TCG TCG CGC GGG ACC 
2223 2232 2241 2250 2259 2268 

TCG ACG AGG ACG AGC TGA TCG ACG AGG ACT TCA AGA ACG AGC AGC GCG CCC TGG 



STRTS* STRTSRTSSAPW 
RRGRADRRGLQE RA ARPG 
DEDELI DEDFKNEQRALV 

GGGL GDEEVGLQLGVEGL 
AGASAMKRLALSSASRAS 
RGRRPWRG*RWAPPRGRR 



AGC GGG GGC GGC TCC GGT AGA AGG AGT TGC GGT TCG ACC TCC GGC TGG AGC GGC 
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2277 2286 "2295^ 2304 ' 2313 2322 

TCG CCC CCG CCG AGO CCA TCT TCC TCA ACG CCA AGC TGG AGG CCG ACC TCG CCG 



SPPPRPSSSTPSWRPTSP 
RPRRGHLPQRQA GGRPRR 
APAEAI FLNAKLEADLAE 

EVVVLGEFEELGDALVLG 
SSSSSARSSRWDTPWSSG 
ARRR R P G R VGG T R R G .P R A 



TCG AGC TGC TGC TGC TCC GGG AGC TTG AGG AGG TCA GGC AGC CGG TCC TGC TCG 
2331 2340 2349 2358 2367 2376 

AGC TCG ACG ACG ACG AGG CCC TCG AAC TCC TCC AGT CCG TCG GCC AGG ACG AGC 



SSTTTRPSNSSSPSARTS 
ARRRRGPRTPPVRRPGRA 
LDDDEALELLQSVGQDEP 

AEGGEGADAEVGEAQLGV 
PRAVRAR TPKLVRPRCV* 
RGRWGRGRRS *CGRGA SR 



C CGG AGC GGT GGG AGC GGG CGC AGC CGA AGT TGT GGG AGC CGG ACG TCT GGA 
. 2385 2394 2403 2412 2421 2430 

CCG GCC TCG CCA CCC TCG CCC GCG TCG GCT TCA ACA CCC TCG GCC TGC AGA CCT 



P A S P P S P A S A S T P S A C R P 
RP RHPRPRRLQHPRPADL 
GLATLARVGFNTLGLQTY 

Q R G A R L F G A G P G D L L A G G 
RVAPGF SDRAQVMLFPA V 
GSPRGSPIGRR SW*SPRW 



TGG ACT GCC GGC CGG GCT TCC TTA GGG CGC GGA CCT GGT AGT TCT TCC CGC GGT 
2439 2448 2457 2466 2475 2484 

ACC TGA CGG CCG GCC CGA AGG AAT CCC GCG CCT GGA CCA TCA AGA AGG GCG CCA 



*RPARRNPAPGPSRRAP 
PDGRPEGIPRL DHQEGRH 
L T A " G P K E S R A W T I K K G A T 

GGL GGADDVGVELLAEDL 
AGSAAPT MWVSKWFPKML 
RGRPRRR*GCRSGSPS. ** 



GGC GGG GGC TCC GGC GGC CGC AGT AGG TGT GGC TGA AGG TCT TCC CGA AGT AGT 
2493 2502 2511 2520 2529 2538 

CCG CCC CCG AGG CCG CCG GCG TCA TCC ACA CCG ACT TCC AGA AGG GCT TCA TCA 



PPPRPPA SSTP TSRRASS 
RPRGRRRHPHRLPEGLHQ 
APEAAGVIHTDFQKGFIK 

RLD D GE GVQHLGAGD GL G 
ASTMEKVSRTSVPETASA 
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P P P R- ' R *' * R- G" P F ' S R' S" '"R R R P 



TCC GCC TCC AGT AGA GGA AGT GGC TGG ACC ACC TCT GGC CGA GGC AGC GGC TCC 
2547 2556 2565 2574 2583 2592 

AGG COG AGG TCA TCT CCT TCA CCG ACC TGG TGG AGA CCG GCT CCG TCG CCG AGG 



RRRSS P SPTWWRPAPS PR 
GGGHLLHRPGGDRLRRRG 
AEVI SFTDLVETGSVAEA 

ARLPL RT HLALVI HHLVP 
RAFPFARI SPLS *T ICSP 
GRSPS PAYPPCPSHSAPR 



GGG CGC GCT TCC CCT TCC GCG CAT ACC TCC CGT TCC TGA TAG ACT ACG TCC TGC 
2601 2610 2619 2628 2637 2646 

CCC GCG CGA AGG GGA AGG CGC GTA TGG AGG GCA AGG ACT ATG TGA TGC AGG ACG 



PARRGRRVWRARTM*CRT 
PREGEGAYGGQGLCDAG R 
R A K G K A R M E G K D Y V M Q D G 

. VH D L E A E VH LRL E V V-V S S 
ISTTSNRKLTYACNWWSAA 
PRPRTGS*RTPAIG GRRQ 



CCC TGC ACC AGC TCA AGG CGA AGT TGC ACA TCC GCG TTA AGG TGG TGC TGC GAC 
2655 2664 2673 2682 2691 2700 

GGG ACG TGG TCG AGT TCC GCT TCA ACG TGT AGG CGC AAT TCC ACC ACG ACG CTG 



G T W S S S A S T C R R N S T T T L 
GRGRVP LQR VGA I PPRR C 
DVVEFRFNV*AQFHHbAA 

EFACTLLPRSRWPA AGQQ 
KLRAP*FPDVGGPP PG KS 
K*VRLDSPTSEELPRGRA 



/• ^ GAA AGT TTG CGC GTC CAG TCT TCC CCA GCT GAG GAG GTC CCC CGC CGG GGA ACG 
' ^ 2709 2718 2727 2736 2745 2754 

^_rT TCA AAC GCG CAG GTC AGA AGG GGT CGA CTC CTC GAG GGG GCG GCC CCT TGC 



LSNAQVRRGRLLQGAAPC 
FQTRRSEGVDSSRGRPLA 
F K R A G Q K G. S T P P G G G P L L 

KGHQSPAPFAS*GDTKAR 
N GTSP HHQSL. QDDMLRQG 
TERAP I T SPF SI MW*DKG 



ACA AAG GGC ACG ACC CTA CCA CGA CCC TTT CGA CTA GTA GGT AGT CAG AAA CGG 
2763 2772 2781 2790 2799 2808 

TGT TTC CCG TGC TGG GAT GGT GCT GGG AAA GCT GAT CAT CCA TCA GTC TTT GCC 



CFPCWDGAGKADHPSVFA 
VSRAGMVLGKLI IHQSLP 
FPVLGWCWES*SSISLCP 
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GSSTLLPVNNPVVQPFPD 
APPH*SHYT-ILYWKLSPT 
QRLIDLTTR**TGSSPLP 

GAG GGC CTC CTA GAG TTC TCA CCA TGC AAT AAT CCA TGG TGA ACT CCC TTC CCC 
2817 2826 2835 2844 2853 2862 

CTG CCG GAG GAT GTC AAG AGT GGT ACG TTA TTA GGT ACC ACT TGA GGG AAG GGG 

LPEDVKS GTLLGTT * GK G 
CRRMSRV VRY*VPLEGRG 
AGGCQEWYVIRYHLREGV 

F*TSLGRAF GCPEREAS* 
SDHRYVALSAALSEKRQD 
RIMDIFRSRLRLARKGSI 

AGC TTA GTA CAG CTA TTT GGC GCT CGC TTC GGC GTT CCG AGA GAA AGG CGA CTA 
2871 2880 2889 2898 2907 2916 

TCG AAT CAT GTC GAT AAA CCG CGA GCG AAG CCG CAA GGC TCT CTT TCC GCT GAT 

_SNHVDKP.RAKPQGS L SAD 
fjm\,^ I<ff)siNRERSRKALFPL I XZ. 
ESCR*TASEAARLSFR*S 
==> 

SP*RCDRPWRSRRWARCR 
L L D V V I V L GDL D D G L V A. V. 
LFTLSL* SAMSITELC P L 

GTT CTT CCA GTT GCT GTT AGT GCT CCG GTA GCT CTA GCA GAG GTT CGT GCC GTT 
2925 2934 2943 2952 2961 2970 

CAA GAA GGT CAA CGA CAA TCA CGA GGC CAT CGA GAT CGT CTC CAA GCA CGG CAA 

Q EG QRQSRGHRDRLQARQ 
KK VNDNHE AIE IVSKH GN 
RR STTITRPSRSSPSTAT 

RV RRPRPNHLAARP STGA 
.^GYEDRGL I ICRQALARVQ 

' TSTEASS*AASRS PEYR 

— 

GCG GCA TGA GCA GAG CCG GCT CCt AAT ACG TCG CGA CGC GCT CCC GAG CAT GGA 
2979 2988 2997 3006 3015 3024 

CGC CGT ACT CGT CTC GGC CGA GGA TTA TGC AGC GCT GCG CGA GGG CTC GTA CCT 

RRTRLGRGLCSA ARGLVP 
AVLVS AEDYAALREGSYL 
PYSSRPRIMQRCARARTC 

ASEPSRGDVA* PT RSRGQ 
QARRRVGTSQELRVLVGK 
SREGAFARRSSLAYSFAR 

CGA CGC GAG AGG CCG CTT GCG GGC AGC TGA CGA GTT CCG CAT GCT CTT GCG GGA 

3033 3042 3051 3060 3069 3078 . 

GCT GCG CTC TCC GGC GAA CGC CCG TCG ACT GCT CAA GGC GTA CGA GAA CGC CCT 
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LRSPANARRLLKAYENAL 
CALRRTPVDCSRRTRTPL 

GR*HTPAPASRDPNPPRQ 
GVDIHRLPLQDIRIRRVS 
AWTLT DSRSSISGSEASA 

ACG GGT GCA GTT ACA GAG GOT CGC CCT CGA CTA GCT AGG CCT AAG CCG COT GCG 
3087 3096 3105 3114 3123 3132 

TGC CCA CGT CAA TGT GTC GGA GCG GGA GCT GAT CGA TCC GGA TTC GGC GGA CGC 

CPRQCVGAGADRSGFGGR 
AHVNVSEREL IDPDSADA 
PTSMCRSGS*SIRIRRTL 

NPHR TL S TKSS * PQ S S * V 

TRTGRSAQRRPDP SPHSC 
P >EPAAHPKDELILAP IVV 

ACC AAG CCC ACG GCG CAC TCC GAA CAG AAG CTC CTA GTC CCG ACC CTA CTG ATG 
-/l/, . 3141 3150 3159 3168 3177 3186 

TTC GGG TGC CGC GTG AGG CTT GTC TTC GAG GAT CAG GGC TGG GAT GAC TAC 

W. F G C R. ^) RLVFEDQGWDDY V3 
GSGAA-*GLSSRIRAGMTT 
V R V P R E A^ CLRGSGLG *LH 

D Q S L F S R L I S A R M L.L S M S 
T R A * S R G C SARGC * CA * R 
RGPELVVALHE GA DVLED 

TGC AGG ACC GAG TTC TTG CTG GCG TTC TAC GAG CGG GCG TAG TTG TTC GAG TAG 
3195 3204 3213 3222 3231 3240 

ACG TCC TGG CTC AAG AAC GAC CGC AAG ATG CTC GCC CGC ATC AAC AAG CTC ATC 

T SWLKNDRKMLAR I NKL I- 
yR PGSRT TARCSPAS T S S S 
>VLAQERP QDARPHQQAHR 

SSTLRSGKVPIPLGS GSFY 
P R * "A R G " R * P S R- C V R A A S T 
LVDPAVGERPDAFGLRQL 

CTC CTG CAG TCC GCG CTG GGG AAG TGC CCC TAG CCG TTT GGG CTC GGC GAC TTC 
3249 3258 3267 3276 3285 3294 

GAG GAC GTC AGG CGC GAC CCC TTC ACG GGG ATC GGC AAA CCC GAG CCG CTG AAG 

EDVRRDPFT GIGKPEPLK 
R T S GAT P SRGSA.NP SR * S 
GRQARPLHG DRQTRAAEV 

WKGPAHDRRISSSCRRTY 
GSAPPTTAASRRRVGGRT 
VVQRPRPRPPDVVFVAEH 




ATG GTG AAC GGC CCC CGC ACC AGC GCC GCC TAG CTG CTG CTT GTG GCG GAG CAC 
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TAG CAC TTG CCG GGG GCG TGG TCG CGG CGG ATC GAG GAG GAA GAG CGG GTG GTG 

Y H L P G A W S R R I D D E H R L V 
TTG RGRGRGGSTTNTASG 

PLAGGVVAADRRR TPPRV 

RTVSLS ITIRAARYW*QS 
GP*PCPSRSG RQGTGSSV 

V QNRVLLDHDESGPVVVS 

ATG GAG GAA TGG GTG TTG GTG TAG GAG TAG GAG GGA GGG GGG ATG GTG ATG AGT 
3357 3366 3375 3384 3393 3402 

TAG GTG GTT AGG GAG AAG GAG ATG GTG ATG GTG GCT GGG GGG TAG GAG TAG TGA 

YL VTDKE IVILAARY HY* 
TWLRTRRS*SSL PGTTTD 
PGYGQGDRDP RGPVPLLT 

GLH DERAPITSPHAGRVR 
AWTTRGHQSPAPIPGEFG 
QGPPGGTSPHHQS P GRSG 

m 

3411 3420 3429 3438 3447 3456 

CTG CCC AGG TGG TCC TCC CGT GCT GGG ATG GTG CTG GGA TGG GCC CCT CGA ACC 





^h^CJAC GGG TCC AGG AGG AGG GGA GGA GCG TAG CAC GAG GCT AGG GGG GGA GCT TGG 



LPRWSSRAGMVLGWAPRT 
CPGGPPVLGWGWDGPLEP 
AQVVL P GWD GAGMGP S N P 

HK RLHSSQL*HEAEVNLR 
ING CTPARYNINRKLT*A 
STEAPP LETTLTGS *RKP 

GCT ACA AAG GGG TGG AGG GTG GAG AGA TGA ATT AGA AGG GGA AGT TGG AAA TGG 
3465 3474 3483 3492 3501 3510 

pGA TGT TTC CGG AGG TGG GAG CTG TGT AGT TAA TGT TGG GCT TGA AGG TTT AGG 




||[|H CFRRWELGS*CSA STFR. 

^ ' D vsaggssvvnvplqrlg 

M F P Q V G a L * . L M F R F N V * A 

LDVVDDQQIRLDSPDSED 
C I WWTTKNFACTLPTRSM 
ASGGRRRTSHAP*LP GV* 

GGG TCT AGG TGG TGG AGG AGA ACA ACT TAG GCG TCC AGT GTG GCC AGG CTG AGT 
3519 3528 3537 3546 3555 3564 

CGG AGA TGG AGG AGG TGG TGT TGT TGA ATG GGG AGG TGA GAG GGG TCC GAG TGA 

RRSTTSSC*MRRSEGSDS 
ADPPRRLVEGAGQRGPTH 
QIHHVVLLNAQVR G VRL I 

SDPGQSKGTGGASQS NSL 
PTPGRARERAEPLSPTA* 
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AGC CTC AGC CCG GGG ACC GAG AAA GGG CAC GGA GGC CGT CTG ACC CTC AAC GAG 
3573 3582 3591 3600 3609 3618 

TCG GAG TCG GGC CCC TGG CTC TTT CCC GTG CCT CCG GCA GAC TGG GAG TTG CTC 



SESGPWLFPVPPADWELL 
RSRA PGSFPCL RQTGSCS 
GVGPLALSRASGRLGVAQ 

* *RGIPCYP*GTWLALA SW 
DDGASRATPGQGSRWRPG 
TMVQR. D P L LARD L A G AR V 



TCA GTA GTG GAC GGC TAG CCC GTC ATC CCG GGA CAG GTC TCG CGG TCG CGC CTG 
3627 3636 3645 3654 3663 3672 

AGT CAT CAC CTG CCG ATC GGG CAG TAG GGC CCT GTC CAG AGC GCC AGC GCG GAC 



SHHLPIGQ*GPVQSASAD 
V I T C R.S G S RAL S R A P A .R T 

SSPADRAVGPC PERQRGP 

NSPIMQRDTG TL I EADAH 
rfUi^V^T PLS*RATR VPSSRPTPT 
LQFPDDPPG YRHPDRRRR 



GTC AAC CTT CCC TAG TAG ACC GCC AGG CAT GGC CAC TCC TAG AGC CGC AGC GGC 
3681 3690 3699 3708 3717 3726 

CAG TTG GAA GGG ATC ATC TGG CGG TCC GTA CCG GTG AGG ATC TCG GCG TCG GCG 



QLEGI IWRSVPVRI SAS A 
SWKGSSGGPYR*GSRRRR 
VGRDHLAVRTGEDLGVGV 

TGFRALTFCHAG GSFCFE 
PASAPW.PSATPAA P SAS S 
PHRLPGPHLLPRRRLLLV 



££C CAC GGC TTC GCC CGG TCC CAC TTC GTC ACC CGC GGC GGC CTC TTC GTC TTG 
I . 3735 3744 3753 3762 3771 3780 

^rGG GTG CCG AAG CGG GCC AGG GTG AAG CAG TGG GCG CCG CCG GAG AAG CAG AAC 



WVPK RARVKQWAPPE KQN 
GCRSG PG* SSGRRRR SRT 
GAEAGQGEAVGAAGEAEL 

SAPPLDGIRERFTARRGV 
APRPCTASANASRPADA* 
RQGPAPRRHTRP VHRTPR 



AGC GAC CGG CCC CCG TCC AGC GGC TAG GCA AGC GCC TTG CAC CGC GCA GCC GGA 
3789 3798 3807 3816 3825 3834 

TCG CTG GCC GGG GGC AGG TCG CCG ATG CGT TCG CGG AAC GTG GCG CGT CGG CCT 



SLAGGRSPMRSRNVARRP 
RWPGAGRRCVRGTWRVGL 
AGRGQVADAFAERGASAY 
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GILW.AATLRSRWEYGLL. 
AS*GPPPSAHAGSTASSP 
RRDALRRHPTLAVRLRPP 



TGC GGC TAG TCG GTC CGC CGC CAC TCC GCA CTC GCG GTG AGC ATC GGC TCC TCC 
3843 3852 3861 3870 3879 3888 

ACG CCG ATC AGC CAG GCG GCG GTG AGG CGT GAG CGC CAC TCG TAG CCG AGG AGG 



TP I SQAAV RRERH S * P RR 
RRSARRR*GVSA TRSRGG 
ADQPGGGEA*APLVAE E( 

EW. EAHTITAADD ILHRTJ 
RGSPMPSRPQTTSSTVPS 
GGVRCPHDHSRRRHPSPH 



CGG AGG GTG AGC CGT ACC CAC TAG CAC CGA CGC AGC AGC TAC TCC ACT GCC CAC 
3897 3906 3915 3924 3933 3942 

GCC TCC CAC TCG GCA TGG GTG ATC GTG GCT GCG TCG TCG ATG AGG TGA CGG GTG 



^ A S H S A W V I V A A S S M R * R V 
<^^P PTR HG * SWLRRR * G D G * 
^J^f^ LPLGMGDRGCV VDEVTGj 

RE AHPWGPRLVRGSKLD] 
ANPTPGGPGC SAVAK * T. A 

ltrrpa vr aaprsrkepr 



TTC GCA AGC CGC ACC CCG GTG GGC CCG GCG TCC TGC GCT GGC GAA AAG TCC AGC 
3951 3960 3969 3978 3987 3996 

AAG CGT TCG GCG TGG GGC CAC CCG GGC CGC AGG ACG CGA CCG CTT TTC AGG TCG 



krsawghpgrrtrplfrs 

SVRRGATRAAGRDRFSGR 
AFGV^GPPGPQD^ATAFQV. 



CRP RD S DK S TVY RE I VY 




GCC GTC GCG CCC GCC AGG CTC AGG AAC GAG CAG TGC ATC GCG AGC TAG TGC ATC 
4005 4014 4023 4032 4041 4050 

CGG CAG CGC GGG CGG TCC GAG TCC TTG CTC GTC ACG TAG CGC TCG ATC ACG TAG 



RQR GRSESLLVT*RS I T* 
GSAGGPSPCSSRSARSRS 

aaravrvlarhvaldhv. 

ygseeshqfpm 'pwre py: 
taarrptssrcrggrrtc 

RLREGRLAPVADAVEGPV 



GGC ATC GGC GAG AGG AGC CTC ACG ACC TTG CCG TAG CCG GTG GAG AGG CCC ATG 
4059 4068 4077 4086 4095 4104 

CCG TAG CCG CTC TCC TCG GAG TGC TGG AAC GGC ATC GGC CAC CTC TCC GGG TAC 
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RSRSPRSAGTASAT SPOT 
VAALLGVLERHRPPLRVQ 

DTRDIWTPAVFI SGGVPA 
IPVTSGPPPSSSAAASPP 
SRYPRDLHPRRLHQRRRP 



TCT AGC CAT GCC AGC TAG GTC CAC CCC CGC TGC TTC TAG GAG GGC GGC TGC CCC 
4113 4122 4131 4140 4149 4158 

AGA TCG GTA CGG TCG ATC GAG GTG GGG GCG ACG AAG ATG CTG CCG COG ACG GGG 



RSVRSIQVGATKMLPPTG 
DRYGRSRWGRRRCCRRRG 
IGTV DPGGGDEDAAADGG 

ESAELLSWTHSE E V L H E W 
KPPKWCPGPTPSK SWTNG 
SRL S GA P V L H P VR R GP T G 



CGA AGC CTC CGA AGG TCG TCC CTG GTC CAC ACC CTG AGA AGC TGG TCC ACA AGG 
4167 4176 4185 4194 4203 4212 
TCG GAG GCT TCC AGC AGG GAC GAG GTG TGG GAG TCT TCG ACC AGG TGT TCC 
.i/^i- - 

ASEAS SRDQVWD S S TRC S 
LRRLPAGTRCGTLRPGVP 
FGGFQQGPGVGLF. D QVFP 

P ASWDL EWDLGT GS I GY T 
PRAG*rSNGT WAPAP SATR 
LARELRTGLGPRHRLHRV 



GTC CCG CGC GAG GTC AGC TCA AGG GTC AGG TCC GGC CAC GGC CTC TAG GGC ATG 
4221 4230 4239 4248 4257 4266 

CAG GGC GCG CTC CAG TCG AGT TCC CAG TCC AGG CCG GTG CCG GAG ATG CCG TAG 

QGALQSSSQSRPVPEMPY 



RARSSRVPSPGRCRRC RT 




HPRRGGA LVPLPPDSPRP 



CAC GCC AGC CGC AGG TGG GCG GTC TTG GCC CTC ACC TCC TAG TGA ACC CGC ACC 
4275 4284 4293 4302 4311 4320 

GTG CGG TCG GCG TCC ACC CGC CAG AAC CGG GAG TGG AGG ATC ACT TGG GCG TGG 



VRSASTRQNREW.RITWAW 
CGRRP PARTGSG GS LGRG 
AVGVHPPEPGVE DHLGVV 

ALDNIIETFHAPASNP*P 
PWTTSSRPSTPPRRTRD P 
RGPRQHD RHLPR .AG L E T L 



AGC CGG TCC AGC AAC TAG TAG AGC CAC TTC ACC CGC CCG CGG CTC AAG CCA GTC 
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432a 4338 * — ' 43^47 4356 4565-^^' 4374 

TCG GCC AGG TCG TTG ATG ATC TCG GTG AAG TGG GCG GGC GCC GAG TTC GGT GAG 



SARSLMI SVKWAGAEFGQ 
RPGR** SR*SGRAPSSVR 
GQVVDDLGE VGGRRVRS( 

GAGMGQRQPR*RGAPRD] 
GRAW ERVSPDDADLLAIL 
AG RGNG .SAPTTLTWCPS * 

CCG GGG CGC GGG TAA GGG ACT GCG AGO CCA GCA GTC GCA GGT CGT CCC GCT AGT 
4383 4392 4401 4410 4419 4428 

GGC CCC GCG CCC ATT CCC TGA CGC TGG GGT CGT CAG CGT CCA GCA GGG CGA TCA 

GPAPIP*RWGRQRPAGRS 
APRPFPDAGVVSVQQGDQ 
PRA HSLTLGSSASSRAI] 

R.PLLTPRSGRRLGR .HR D 1 
APCCR PDAVEEFVE lATL 
P PAAAH T Q * RKS S R S.P P * 



> CCC GCC CCG TCG TCG CAC CCA GAC GAT GGA GAA GCT TCT GGA GCT ACC GCC AGT 
4437 4446 4455 4464 4473 4482 

GGG CGG GGC AGC AGC GTG GGT CTG CTA CCT CTT CGA AGA CCT CGA TGG CGG TCA 

GRG.SSVGLLPLRRPRWRS 
GGAAAWVCYLFEDLDGGQ 
AGQQRGSATSSKTSMAVS 

PRLQGPYA ARRHDYPNR^ 
RGFSGLTPLGGI ITLIAD 
GASAAWPLCGASSRLSQT 

CGG CCG GCT TCG ACG. GGT CCC ATC CGT CGG GCG GCT ACT AGC ATT CCT AAC GCA 
4491 4500 4509 4518^ 4527 4536 

GCC GGC CGA AGC TGC CCA GGG TAG GCA GCC CGC CGA TGA TCG TAA GGA TTG CGT 



GRS CP G *AARR * S * GLR 
PAEAAQGRQPADDRKDCV 
R P K L P R V G S P P M I V R I A £ 



SRHRGAARPRRILRRRRF 
RGIDVLQARAA. YSADDDG 
VVSTSWSRAPPTHPTTTA 

GTG CTG GCT ACA GCT GGT CGA CGC GCG CCC GCC GCA TAG TCC GCA GCA GCA GCG 
4545 4554 4563 4572. 4581 4590 

CAC GAC CGA TGT CGA CCA GCT GCG CGC GGG CGG CGT ATG AGG CGT CGT CGT CGC 

HDRCRPAARGRRMR RRRR 
TTDVDQLRAGGV*GVVVA 
RPMSTSCARAAYEASSSP 

RAAPRP DRHPPDH HA P H G 
DLQQVLTEIHPTTTRRTA 
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GCA GCT CGA CGA CCT GCT CCC AGA GCT ACA CCC CCC AGC ACC ACG CGG CCC ACC 
4599 4608 4617 4626 4635 4644 

CGT CGA GCT GCT GGA CGA GGG TCT CGA TGT GGG GGG TCG TGG TGC GCC GGG TGG 

RRAAGRGSRCGGSWCAGW 
VELLDEGLDVGGRGAPGG 
SSCWTRVS MWGVVVRRVA 

HRWLHPAVLLAGP PRRAV 
MVGSTPLWWCLAP RDDPW 
W S A L P P S G G A S R R A T T P G 

GGT ACT GCG GTC TCC ACC CCT CGG TGG TCG TCT CGC GGC CCG CCA GCA GCC CGG 
4653 4662 4671 4680 4689 4698 

CCA TGA CGC CAG AGG TGG GGA GCC ACC AGC AGA GCG CCG GGC GGT CGT CGG GCC 

P*RQRWGATSRAPGGRRA 
HDARGGEPPAERRAV VGP 
MTPEVGSHQQSA GRS SGH 

PRPGRSGPRRLPRTDPRR 
y PARDEAAR.DEFPARTLDV 
RPATRP Q GTKSPPAH * T S 

TGC CCC GCG CCA GGA GCC GAC GGG CCA GAA GCT TCG CCC GCG CAC AGT CCA GCT 
4707 4716 4725 4734 4743 4752 

ACG GGG CGC GGT CCT CGG CTG CCC GGT CTT CGA AGG GGG CGC GTG TCA GGT CGA 

T GRG P R L P GLR R G R V S G R 
RGAVLGCPVFEGGACQ V D 
GARSSAARS SKGARVRST 

PALRPRAARGRGAPPR VA 
P R WA P D L P E D E A P P R V Y R 
PAG PPT SRSTR PRRASTG 

, ^CC CCG CGG TCC GCC CCA GCT CGC CGA GCA GGA GCC GGC CGC CCG CCT GCA TGG ■ 
'^it0 ^'^^^ ^'^'^^ ^'^'79 4788 4797 4806 

'CGG , GGC GCC AGG CGG GGT CGA GCG GCT CGT CCT CGG CCG GCG GGC GGA CGT ACC 

RGARRGRAARP RPAGGRT 
GAPGGVERLVLGR RADVP 
GRQAG S S G S S SAG GR T Y R 



^ 

S RA PRLACQDRAVDRCGG 
RGHQACPA NIGHST®AAG ^vS^ 
GVTS P A PR MS GT, RR * p L G. 

CGG CTG GCA CGA CCC GCG TCC CGC GTA ACT AGG GCA CGC TGC AGT GCC GTC GGG 
4815 4824 4833 4842 4851 4860 

GCC GAC CGT GCT GGG CGC AGG GCG CAT TGA TCC CGT GCG ACG TCA CGG CAG CCC 

ADRAGRRAH*SRATSRQP 
PTVLGAGRI DPVRRHGSP 
RP CWAQGALIPCDVTAAP 
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PRG*PPA RL*KTLALLPL 
QGAELRPACDNQLHWSRF 
RAPRLAPRATMKYTGPAS 



GGA CCG GCC GGA GTT CCG CCC CGC GCG TCA GTA AAA CAT TCA CGG TCC TCG CCT 
4869 4878 4887 4896 4905 4914 

CCT GGC CGG CCT CAA GGC GGG GCG CGC AGT CAT TTT GTA AGT GCC AGG AGC GGA 

PGRPQGGARSHFVSARSG 
LAGLKAGRAVIL*VPGA E 
W PASRRGAQSFCKCQERK 

YAG EFPLIVHLASAPPEA 
IP EKSHCS*TSLP RRRSP 
S L SRR I A L DR P S R VG A AR 

TCT ATC CGA GGA AGC TTA CCG TTC TAG TGC ACC TCT CGC CTG CGG CCG CCG AGC 
4923 4932 4941 4950 4959 4968 

AGA TAG GCT CCT TCG AAT GGC AAG ATC ACG TGG AGA GCG GAC GCC GGC GGC TCG 

R*APSNGKITWRADAGGS 
(rl^y D R L L R (M) ARSRGERTPAAR 
ijlP^P IGSFEWQ_DHVESGRRRLG 



S*RVCRENGATAPVARCG 
PDG*AVSTELLPLCQEAV 
RIVERLA RKWC HCASSPL 

CGC CTA GTG gag TGC GTT GCG AGC AAA GGT CGT CAC CGT CCG TGA CGA GCC GTT 
4977 4986 4995 5004 5013 5022 

GCG GAT CAC CTC ACG CAA CGC TCG TTT CCA GCA GTG GCA GGC ACT GCT CGG CAA 

A DHLTQRS FPAVAGTARQ 
RITSRN ARFQQW QALLGN 
G S P HA T L VS S S G RH C S A T 

C .CACARRHTGPSPLGGSR 
f-^^AV. LARAGTLEQHHSDARD 
''%cm'^^ LLRVRAPSNRTIPTRGI 



V y--- 

GGC GTT GTT CGC GTG CGC GCG GCC ACT CAA GGA CCA CTA CCC TCA GGC GGG CTA 
5031 5040 5049 5058 5067 5076 

CCG CAA CAA GCG CAC GCG CGC CGG TGA GTT CCT GGT GAT GGG AGT CCG CCC GAT 

PQQAHARR*VPGDG SPPD 
RNKRTRAGEFLVMGVRP I 
ATSARAPVSSW* WESARS 

ARP.PARSA RVC AGRRRVA 
RERHLVAPGYAREEVVSL 
ESATSCPQGTRVSR*S PC 

GAG CGA GCG CCA CCT CGT GCC GAC CGG GCA TGC GTG CGA GGA GAT GCT GCC TGT 
5085 5094 5103 5112 5121 5130 

CTC GCT CGC GGT GGA GCA CGG CTG GCC CGT ACG CAC GCT CCT CTA CGA CGG ACA . 
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S LAV E H GWPVR T L L Y D GQ 
RSRWSTAGPYARSSTTD5 

PATSTPAPAEEYPASPAJ 
PLQRLPRPLKKTRHPRLL 
RSSDFHARSSRRVTRVSC 

CGC CCT CGA CAG CTT CAC CCG CGC CCT CGA AGA AGC ATG CCA CGC CTG CCT CGT 
5139 5148 5157 5166 5175 5184 

GCG GGA GCT GTC GAA GTG GGC GCG GGA GCT TCT TCG TAG GGT GCG GAG GGA GCA 

AGAVEVGAGASSYGADGA 
REL. SKWARELLRTVRTEQ 
GSCRSGRGSF FVRCGRSI 

RSPGPGASPAPPSSRPGi 
DRHGRVQQHLQPLLVLGR 
lAIAGSRSISSPSFF SAG 

CTA GCG CTA CCG GGG CCT GGA CGA CTA CCT CGA CCC CCT CTT CTT GCT CCG GGG 
5193 5202 5211 5220 5229 5238 

'tdjgAT CGC GAT GGC CCC GGA CCT GCT GAT GGA GCT GGG GGA GAA GAA CGA GGC CCC 




DRDGPG PAD GAGGE ERGP 
I AMAPDLLMELGEK NE AP 
SRWPRTC*WSWGRRTRPI 

RPRR RR P SARRR GR G S GI 
GLDD G DH LHGGVVE VP DR 
GS TTATTSIGASSRSRIG 

CGG GCT CCA GCA GCG GCA GCA CCT CTA CGG GCG GCT GCT GGA GCT GGC CTA GGG 
5247 5256 5265 5274 5283 5292 

GCC CGA GGT CGT CGC CGT CGT GGA GAT GCC CGC CGA CGA CCT CGA CCG GAT CCC 

A R GR R R R GDAR R R P R P D P 

P EVVAVVEMPAD DL DR I P 
rVjPRSSPSWRCPPT TSTGSi 

GPPSGPRVTRGASWDPSC 
D P L V E Q A Y Q" E V P R G T R P V 
TRSSKRPTSNSRGVLGPF 

CCA GGC CCT CCT GAA GGA CCC GCA TGA CAA GCT GGC CGG CTG GTC AGG CCC CTT 
5301 5310 5319 5328 5337 5346 

GGT CCG GGA GGA CTT CCT GGG CGT ACT GTT CGA CCG GCC GAC CAG TCC GGG GAA 

GPGG L P GRTVRP AD Q S GE 
VREDFLGVLFDR PT SPGN 
SGRT SW .AYCSTGRPVRGl 

RCC*ESPPHGPRARASRi 
DAADNARRIGQARVPQDH 
MPLMMREASARPACPS I T 



GTA GCC GTC GTA GTA AGC GAG CCG CCT ACG GGA CCC GCG CGT GCC CGA CTA GCA 
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5355:^ " 5364""— - * 53T3 538-2-^ 5391 " ' 5400 

CAT CGG CAG CAT CAT TCG CTC GGC GGA TGC CCT GGG CGC GCA CGG GCT GAT CGT 



HRQHHS LGGCPGRARADR 
IGSI IRSADALGAHGLIV 
SAASFARRMPWA RTG*SW 

PARRRRRRGSIPGTSCRS 
RPVGGVDVVRFRDPRAGA 
APCAAST*SGFDTRDLVP 

CCG CCC CGT GCG GCG GCT GCA GAT GCT GGG CTT TAG CCA GGC CAG CTC GTG GCC 
5409 5418 5427 5436 5445 5454 

GGC GGG GCA CGC CGC CGA CGT CTA CGA CCC GAA ATC GGT CCG GTC GAG CAC CGG 

GGARRR RL RPEI GP V E H R 
AGHAADVYDPKSVRSSTG 
RGTPPTST TRNRSGRAPA 

ATRGARRGPATVPRP SP S 
RQEGQGGDPHR*RALHHV 
ESNERGATRTGDGPSTIS 



't^G CGA CAA GAG GGA CGG GCG GCA GGC CCA CGG CAG TGG CCC GCT CCA CTA CCT 
5463 5472 5481 5490 5499 5508 

CTC GCT GTT CTC CCT GCC CGC CGT CCG GGT GCC GTC ACC GGG CGA GGT GAT GGA 

LAVLP A. RRPG AVTGRGDG 
SLFSLPAVRVPSPGEVMD 
RCSPCPPSGCRHRAR*WT 

PPPGG .PRRCASRGPRY PR 
PHLGAP GGARRDDQDT RV 
QTSARRAAPVGI TRTPVS 

GAC CCA CCT CCG GGC GGC CCG GCG GCC GTG CGG CTA GCA GGA CCA GCC ATG CCT 
5517 5526 5535. 5544 5553 5562 

CTG GGT GGA GGC CCG CCG GGC CGC CGG CAC GCC GAT CGT CCT GGT CGG TAC GGA 

"A' ~ — 

GGGPPGRRHADRPGRY G 
WVEARRAAGTPIVLVGTD 
G W ■ R p A G P P A R R S S W S V R T 

AR RSRHTRSRS*GASGAA 
LVAVAI HEVEVEGLRGQQ 
SCPSQS TNSKSKVWGV R S 

GCT CGT GCC GCT GAC GCT ACA CAA GCT GAA GCT GAA GTG GGT CGG CTG GGA CGA 
5571 5580 5589 5598 5607 5616 

CGA GCA CGG CGA CTG CGA TGT GTT CGA CTT CGA CTT CAC CCA GCC GAC CCT GCT 

RARRLRCVRLRLHPADPA 
EHGDCDVF DFDFTQPTLL 
S T A T A M C.S T S T S P S R P C C 

SRCHSLRA*CRRAYTTRS 
QDAI LCGPEAVGPTRQAV 
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CGA CTA GCC GTT ACT CTG TCG GCC CGA GTC GTT GCG GAG CGC ATG CAA GAG GCT 
5625 5634 5643 5652 5661 5670 

GGT GAT CGG CAA TGA GAC AGC CGG GCT CAG CAA CGC CTG GCG TAC GTT GTG CGA 

ADRQ*D SRAQQRLAYVVR 
LI GNETAGLSNAWRTLCD 
*SAMRQPGSATPGVRCAT 

CP*CGSPRSRSSASRPSR 
VRDADRHGAGRARQVRRV 
*VTLMGIAPEALESFAAF 

GAT GTG CCA GTC GTA GGG CTA CCG GCC GAG GCG CTC GAG CGA CTT GCG CCG CTT 
5679 5688 5697 5706 5715 5724 

CTA CAC GGT CAG CAT CCC GAT GGC CGG CTC CGC GAG CTC GCT GAA CGC GGC GAA 

LHG QHPDG RLRELAERGE 
YTVS I PMAGSAS SLNA AN 
TRSASRWPAPRAR*TRRT 

" RSRSGRRLPVAAS*RFFR 
.~Vg RGRDEVFRYPLPDASSG 
AAV AIR*SATRCRILPLV 

GCG GCG CTG GCG CTA GGA GAT GCT TCG CCA TGC CGT CGC CTA GTC GCC TTC TTG 
5733 5742 5751 5760 5769 5778 

CGC CGC GAC CGC GAT CCT CTA CGA AGC GGT ACG GCA GCG GAT CAG CGG AAG AAC 

RRDRDPLRSGTAADQRKN 
AATAI L YEAVR QR I S GR T 

PRPRSSTKRYGSGS AEEP 

LLERL LRP YNYRARARDQ 
C CSGSCG PTTTGPGRGTR 
A .VVGQAAPPLQV QGAGPG 

^ . G^G TTG TTG AGG GAC TCG TCG . GCC CCC ATC AAC ATG GAC CGG GCG CGG GCC AGG 
^"Clm 5787 5796 5805 5814 5823 5832 

*^^^GC AAC AAC TCC CTG AGC AGC CGG GGG TAG TTG TAC CTG GCC CGC GCC CGG TCC 

RNNSLSSRG* (l) Y L A R A R S 
ATTP*AAGGSCTWPAPGP 
QQLPEQPGVVV P^ G P R P V L 

IRGVIEAHREFDGAL.RGL 
SGGWSRRTGSSTAQWVAW 
PDAGRD GRAARL RRG S P G 

ACC TAG GCG GGG TGC TAG AGG CGC ACG GCG AGC TTC AGC GGA CGG TCT GCC GGG 
5841 5850 5859 5868 5877 5886 

TGG ATC CGC CCC ACG ATC TCC GCG TGC CGC TCG AAG TCG CCT GCC AGA CGG CCC 

WIRPTI SACR SKSPARRP 
GSAPRSPRAARSRLPDGP 
DPPHDLRVPLEVACQTAQ. 
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TAAPDSGLTLAEVDGEYV 
RPLPTRAWR*LRSTVRTC 
AHCRPGLGADSGRR*GRV 



TCG CAC CGT CGC CCC AGG CTC GGG TCG GAG TCT CGG AGC TGC AGT GGG AGC ATG 
5895 5904 5913 5922 5931 5940 

AGC GTG GCA GCG GGG TCG GAG CCC AGC GTC AGA GCC TCG ACG TCA CCC TCG TAG 



SV.AAGSEPSV RASTSPSY 
AWQRGPSPASEPRRHPRT 
RGSGVRAQRQSLDVTLVH 

SSMFEAEP PLVPLSGSAL 
PPCSNRKPRCCRCPARRS 
RL VH I G S RAAAGA P L G VR 



TGC CTC CTG TAG TTA AGG CGA AGC CCG CCG TCG TGG CCG TCG CTC GGG CTG CGC 
5949 5958 5967 5976 5985 5994 

ACG GAG GAG ATG AAT TCG GCT TCG GGC GGG AGC AGC GGC AGG GAG CCC GAC GCG 



^TEDMNSASGGSTGREPDA 
''%k' RRT* IPLRAAAPAGSPTR 
'(^^ GGHEFRFGR Q HRQGARRE 

TELMR ATFLGTDAVLPSV 
RKSCGPR SCGRTPWSRAS 
ANRADP GHVA GHR GRA. PQ 



TCG CAA AGC TCG TAG GCC CGG GAC TTG TCG GGG CAC AGC CGG TGC TCG CCC GAC 
6003 6012 6021 6030 6039 6048 

AGC GTT TCG AGC ATG CGG GCC GTG AAC AGC CCC GTG TCG GCC ACG AGC GGG CTG 



S VSSIRAVNSPVSATSGL 
AFRASGP*TAPCRPRAG* 
RFEHPGREQPRVGHERAD 

L V P T I V A R .G M E T V V H G F P 
:r^W CRR S S P GDWRP S S MD S R 

vMfG AGA HHRGTGDRH RCTRV 



TGG TCG TGG CCG CAC TAG TGC CGG GCA GGG TAG AGC CAC TGC TGT ACA GGC TTG 
6057 6066 6075 6084 6093 6102 

ACG AGC AGC GGC GTG ATG ACG GCC CGT CCC ATC TCG GTG ACG ACA TGT CCG AAC 



TSTGVMTARPIS VTTCPN 
PAPA* *RPVPSR*RHVRT 
QHRRD D GPS HLGDDMSER 

VPP QVEVGS*G NRSG RLH 
CRRS SR SAAEAT .GAGA ST 
AGAAPGRR RKLREPERPP 



CCG TGG CCG CCG ACG TGG AGC TGC GGC GAA GTC GGC AAG GCC GAG GGC GCC TGC 
6111 6120 6129 6138 6147 6156 

GGC ACG GGC GGC TGG ACG TCG ACG CCG CTT GAG CCG TTC CGG CTC CCG CGG AGG 
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APAAGPRRRFSRSGSRGG 
HRRLDLDAASAVPAPAEV 

HGRLRPLDGRGVVARLGS 
IDEFGPCTEGDWWRGCVR 
STRSA PAPRGTGGGGASG 

ACT ACA GGA GCT TCG GCC CCG TCC AGA GGG GCA GGG TGG TGG CGG GCG TCT GGG 
6165 6174 6183 6192 6201 621 0 

TGA TGT OCT CGA AGC CGG GGC AGG TCT CCC CGT CCC ACC ACC GCC CGC AGA CCC 

*CPRSRGRSPRPTTARRP 
DVLEAGAGLPVPPPPADP 

SSKPGQVS PSHHRP QT R^ 

DAAAPGTQRGGRGRHVAE 
IRRLRAQRAAEVVEIFPK 
FGGCGPRDPPRWSRSSRS 

CTT AGG CGG CGT CGG CCC GGA CAG ACC GCC GGA GGT GCT GGA GCT ACT TGC CGA 
6219 6228 6237 6246 6255 6264 

(j^GAA TCC GCC GCA GCC GGG CCT GTC TGG CGG CCT CCA CGA CCT CGA TGA ACG GCT 



ESAAAGPVWRPPRPR* TA 
NPPQPGLSGGLHDLDE RL 
I RRSRACLAAST TSMNG F 

VAGLQQRHVAARLGAGS R 
WRGWNS GIYQLEYDREPG 
GGGGTAASTSCSTTGSRV 

AGG TGG CGG GGG TCA ACG ACG GCT ACA TGA CGT CGA GCA TCA GGG CGA GGC CTG 
6273 6282 6291 6300 6309 6318 

TCC ACC GCC CCC AGT TGC TGC CGA TGT ACT GCA GCT CGT AGT CCC GCT CCG GAC 

STAPSCCRCTAARSPAPD 
PPPPVAADVL 'QLVVPLRT 
r\ ,.HRPQLLPMYCSS*SRSGP 

AGTSATGAPANRFLPLVR 
L E R P H R V L" Q P M G F C P F F E 
SSGHIGYWSPCESVPSSS 

GCT CGA GGG CAC CTA CGG CAT GGT CGA CCC CGT AAG GCT TTG TCC CCT TCT TGA 
6327 6336 6345 6354 6363 6372 

CGA GCT CCC GTG GAT GCC GTA CCA GCT GGG GCA TTC CGA AAC AGG GGA AGA ACT 

RAPVDAVPAGAFRNRGRT 
ELPWM PYQLG HSETG-EEL 
SSRGCRTS WGIPKQGKNS 

GRRALPGDVQAAPRPR QA 
AGDPLPGTLKPQLVLDSL 
PGTPCPAR*SPSCSSTAS 



GCC GGG GCA GCC CGT TCC CCG GGC AGT TGA ACC CGA CGT CCT GCT CCA GCG ACT 
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6381- 6390 - : 6399 - 6'40S^' 6^417 '"" 6426 

CGG CCC CGT CGG GCA AGG GGC CCG TCA ACT TGG GCT GCA GGA CGA GGT CGC TGA 



RPRRARGPSTWAAGRGR* 
GPVGQGARQLGLQDEVAE 
APSGKGPVNLGCRTRSLS 

RLLATALERDLPHRRLQR 
A S Y LRR W N E I SH T GV S S D 
RPT .SGDGIRSRTPASP AT 



CGC GCC TCA TCT CGG CAG CGG TTA AGA GCT AGC TCA CCC ACG GCT GCC TCG ACA 
6435 6444 6453 6462 6471 6480 

GCG CGG AGT AGA GCC GTC GCC AAT TCT CGA TCG AGT GGG TGC CGA CGG AGC TGT 



ARSRAVANSRSSGCRRSC 
RGVEPSPILD^R .VGADGAV 
AE*SRRQ FSIEWVPTELS 

RRHRCRGLPR*FDI I L.RR 
DATAVGGLHG DSI S**AG 
TPPPSVAWTATLFRN DPA 

_ _ 

.AT^CA GCC GCC ACC GCT GTG GCG GGT TCA CCG GCA GTC TTT AGC TAA TAG TCC GCG 
6489 6498 6507 6516 6525 6534 

CGT CGG CGG TGG CGA CAC CGC CCA AGT GGC CGT CAG AAA TCG ATT ATC AGG CGC 



RRRWRHRPS GRQKS I I R ,R 
VGG GDTAQVAVRNRLSG A 
S A ATPPKWPSE IDYQAP 
.> 

DRPFSCALEIQEDSLY QR 
T GPF R AP. WNSRSTRCI S G 
PGQSVLLGTRDARGVS VA 



GCC AGG GAC CCT TTG CTC GTC CGG TCA AGC TAG ACG AGC AGG CTG TCT ATG ACG 
6543 6552 6561 6570 6579 6588 

cgg tcc ctg gga aac gag cag gcc agt tcg atc tgc tcg tcc gac aga tac tgc 

h/^/^R slgneqassicssdryc 
'^T. gpwet srpvrsarptdta 

V P G K R a G Q F D L L V R Q I L P 

aefmfvlhtgwrvdpevp 
prscsclihegactrswr 

PGRVHVCSTNGLARGAGG 



GCC CGG AGC TTG TAC TTG TGT TCT ACA CAA GGG GTC GCG TGC AGG CCG AGG TGG 
6597 6606 6615 6624 6633 6642 

CGG GCC TCG AAC ATG AAC ACA AGA TGT GTT CCC CAG CGC ACG TCC GGC TCC ACC 



RASNMNTRCVPQRTSGST 
GPRT*TQDVFPSARPAPP 
GLEHEHKMCSP AHVRLHR 

LHRPIQEDMRSLAGSVRV 
FIGRSRSTWGRFRAASGS 
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S* S A* A * -P - D - . A- R ' G • D AFAR ' • R Q G P 



CCT TCT ACG GCG CCC TAG ACG AGC AGG TAG GCG CTT TCG CGC GGC GAG TGG GCC 
6651 6660 6669 6678 . 6687 6696 

GGA AGA TGC CGC GGG ATC TGC TCG TCC ATC CGC GAA AGC GCG CCG CTG ACC CGG 



GRCRGICSSIRESAPLTR 
EDAAGSARPSAKARR* PG 
KMPRDLLVHPRKRAADPD 

ECGAEGAA EVYAAVTQSF 
RVARKVRRRWMPPLPRAS 
G*LGS*GGGGCLRCRDPQ 



TGG AGT GTC GGG CGA AGT GGG CGG CGG AGG TGT ATC CGC CGT TGC CAG ACC GAC 
6705 6714 6723 6732 6741 6750 

ACC TCA CAG CCC GCT TCA CCC GCC GCC TCC ACA TAG GCG GCA ACG GTC TGG CTG 



TSQPASPAAST*A'ATVWL 
PHSPLHPPPPHRRQRS .G* 
L TA.R FT RRLHI G GNGLA E 

( \ ^ ' 

' C«\ GAQWHLNGAVLVRAEAMG 
DRRGIF IGP*SCGPKRWE 
IGGALSSERSRAGPSGGN 



TTA GGG CGG ACG GTT ACT TCT AAG GGC CGA TGC TCG TGG GCC CGA AGG CGG TAA 
6759 6768 6777 6786 6795 6804 

AAT CCC GCC TGC CAA TGA AGA TTC CCG GCT ACG AGC ACC CGG GCT TCC GCC ATT 



NPACQ*RFPATSTRASAI 
IPPANEDSRLRAPGLPPF 
S R .L P M K I P G Y E H P G F R H S 

GEWPCVQLWWQRQSDL SF 
ARGLVC RYG GSA S H T * P F 
RGGLSVGTAVVPATLRPF 



( : GGC GGG AGG GTT CCT GTG TGG ACA TCG GTG GTG ACC GCG ACA CTC AGA TCC CTT 
y^im ^^^3 ^Q22 6831 6840 6849 6858 

^^^CCG CCC TCC CAA GGA CAC ACC TGT AGC CAC CAC TGG CGC TGT GAG TCT AGG GAA 



PPSQGHT CSHHWRCE SRE 
R PPKDTPVATTGAVSLG K 
A LPRTHL*PPLAL*V* GK 

SS PFCQHFCQLFCQPCFE 
PVPSVSTFVSSFVSP VFN 
LFQPFVPSFVPS.FVP S L I 



TTC CTT GAC CCC TTT GTG ACC ACT TTT GTG ACC TCT TTT GTG ACC CCT GTT TTA 
6867 6876 6885 6894 6903 6912 

AAG GAA CTG GGG AAA CAC TGG TGA AAA CAC TGG AGA AAA CAC TGG GGA CAA AAT 



KELGKHW*KHWRKHWGQN 
RNWGNT GENTGENTGDKI 
GTGE TLVKTLEKTLGTKF 
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APVAA*PGAELVDAARVL 
LRSRQEPAQRWCTPQGSW 
*GPGSSL PRGGARRSGPG 

AGT CGG CCC TGG CGA CGA GTC CCC GGA CGG AGG TCG TGC AGC CGA CGG GCC TGG 
6921 6930 6939 6948 6957 6966 

TCA GCC GGG ACC GCT GCT CAG GGG CCT GCC TCC AGC ACG TCG GCT GCC CGG ACC 

SAGTAAQGPASST SA ART 
QPGPLLRGLPPARRLPGP 
SRDRCSGACLQHVGCPDQ 

VASRTGIKLRELAKVPAV 
YPRAPASR*GSWPR*PLW 
TRGLPHRDEAAGPGKRSG 

TCA TGC CGG CTC GCC CAC GGC TAG AAG TCG GCG AGG TCC CGG AAA TGC CCT CGG 
6975 6984 6993 7002 7011 7020 

AGT ACG GCC GAG CGG GTG CCG ATC TTC AGC CGC TCC AGG GCC TTT ACG GGA GCC 

.S T A E R V P I F S R S R A F T G A 
(,2(k|, VRPSGCRSSAAPGPLREP 
YG RAGADLQPLQGLYGSH 

PIKRSRDTVAIVAHAPLA 
RSRVAATPSPS*RMRPCR 
GPD*P QPR HRRDGCARAA 

TGG CCC TAG AAT GCC GAC GCC AGC CAC TGC CGC TAG TGG CGT ACG CGC CCG TCG 
7029 7038 7047 7056 7065 7074 

ACC GGG ATC TTA CGG CTG CGG TCG GTG ACG GCG ATC ACC GCA TGC GCG GGC AGC 

TGIL .RLRSVTA ITACAGS 
PGSYGCGR* RRSPHARA A 
RDLTAAVGD GDHRMRGQR 

SALSR LLARWRS RPC R G K 
':^R R S R .A C C P G G G A A R A G A R 
v^^G VRALAA PGAVPQAPVQG 

CGG CTG CGC TCG CTC GCG TCG TCC CGG GCG GTG. GCC GAC GCG CCC GTG GAC GGG 
7083 7092 7101 7110 7119 7128 

GCC GAC GCG AGC GAG CGC AGC AGG GCC CGC CAC CGG CTG CGC GGG CAC CTG CCC 




AAG GGT CAC GCA CGC GAG GGC ATG CCG TCC AGC CGG TCG TGC TGT AGC CCG CGC 
7137 7146 7155 7164 7173 7182 

TTC CCA GTG CGT GCG CTC CCG TAC GGC AGG TCG GCC AGC ACG ACA TCG GGC GCG 
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pt, p V- R* A' L P Y' R S' A S T'' T S G A 

SQCVRSRTAGRPARHRAR 
PSACAPVRQVGQHDIGRG 

GALVAS LARPDFVDATRI 
GPSSPPCRVRISSTRPAS 
VRRPRRVACASRLR GRHP 



CTG GGC CGC TCC TGC CGC CTG TCG CGT GCG CCT AGC TTC TGC AGG CGC CAC GCC 
7191 7200 7209 7218 7227 7236 

GAG COG GCG AGG AGG GCG GAC AGC GCA CGC GGA TCG AAG ACG TCC GCG GTG CGG 



DPARTAD SARGS K T S AVR 
T R R G R R TA H ADRRRPRCG 
PGEDGGQRTRIED VRGAD 

AC PLAGGEATLRERLRRA 
PA RCRVARRR*ASGCGAP 
HRVAACRGGGDPAGAAPP 



TAG CGC GTG CCG TCG CGT GGC GGG AGG CGG CAG TCC GCG AGG GCG TCG GCC GCC 
7245 7254 7263 7272 7281 7290 

^i^TG GCG CAC GGC AGC GCA CCG CCC TCC GCC GTC AGG CGC TCC CGC AGC CGG CGG 

MAHG SAPPSAVRRSRSRR 
W RTAAHRPPPSGAPAA GG 
GARQRTALRRQALPQPAG 

A QAAE L Y S PKG F R E S Q E R 
PRRPRWIP PSASVSARSV 
RGA R G G S L L AQR F A R E A * 



CGC CGG ACG CGC CGG AGG TCT ATC CTC CCG AAC GGC TTT GCG AGC GAG ACG AGT 
7299 7308 7317 7326 7335 7344 

GCG GCC TGC GCG GCC TCC AGA TAG GAG GGC TTG CCG AAA CGC TCG CTC TGC TCA 



AACAA SR*EGLPKRS LCS 
RPARPPDRRACR NARSAH 
J.. GLRGLQ IGGLA ETLALLT 

r 

R E L E RA T L GAP S L L A L N K 

^ G N S S A R P * G P R R S C P S I R 

AT RARARDARGALAPRSE 



GCG GCA AGC TCG AGC GCG CGC CAG TCG GGC CGG CCG CTC TCG TCC CGC TCT AAG 
7353 7362 7371 7380 7389 7398 

CGC CGT TCG AGC TCG CGC GCG GTC AGC CCG GCC GGC GAG AGC AGG GCG AGA; TTC 



RRSSSRAVSPAG.E. SRARF 
AVRARARSARPARAG RDS 
P FELARGQPG RREQGE I -L 

AALELPAPDVDSAIVQRL 
RRSSWRPPTWMPPS*RGC 
EGRAGAPRPGCRLRDGAA 



AAG CGG CGC TCG AGG TCG CCC CGC CCC AGG TGT AGC CTC CGC TAG TGG ACG GCG 
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7407^ 74^16- 7425 ^ 7434- 7443 7452 

TTC GCC GCG AGC TCC AGC GGG GCG GGG TCC ACA TOG GAG GCG ATC ACC TGC CGC 



FAASSSGAGSTSEAITCR 
SPRAPAGRGPHRRR SPAA 
RRELQRGGVHIG GDHLPQ 

SRRHLLGLVTLLYGSG CC 
RAGTCCGWCR*STVAAAA 
ALAPAAAGAGDPPLRQRL 



TCG CTC GCG GCC ACG TCG TCG GGG TCG TGG CAG TCC TCC ATT GGC GAC GGC GTC 
7461 7470 7479 7488 7497 7506 

AGC GAG CGC CGG TGC AGC AGC CCC AGC ACC GTC AGG AGG TAA CCG CTG CCG CAG 



SERRCSSPSTVRR*PLPQ 
ASAGAAAPAPSGGNRCRS 
RAPVQQPQHRQ EVTAAAA 

PDWLTVPGDGPLRALA R Q 
RTGCR*RV TAPSAPSPGS 
, VP GVAD G S RRRP P P R P GA 

> GTG CCC AGG GTG TCG CAG TGG CCT GGC AGC GGC CCC TCC GCC CGC TCC CGG GCG 
7515 . 7524 7533 7542 7551 7560 

CAC GGG TCC CAC AGC GTC ACC GGA CCG TCG CCG GGG AGG CGG GCG AGG GCC CGC 



HGSHSVTGPSPGRRARA R 
TGPTASPDRRRGGGRGP A 
RVPQRHRTVAGEA GEG^^L 

FIETALR.VPFAPYGPASH 
SSRPRWASPSPPTVRRP T 
PLDRDGPPRPLRPLGARv L 



ACC TTC TAG AGC CAG CGG TCC GCC TGC CCC TTC CGC CCC ATT GGG CCG CGC CTC 
7569 7578 7587 7596 ' 7605 7614 

TGG AAG ATC TCG GTC GCC AGG CGG ACG GGG AAG GCG GGG TAA CCC GGC GCG GAG 




E D L G R Q A D G EGG V T ; R R G V 



LVVGCALD SSDI REVAHR 
SCSVAP SIPVTSGSWP 'TA 
P ARCRLRSRFQRDAGR RP 



ACC TCG TGC TGT GGC GTC CGC TCT AGC CTT GAC AGC TAG GCG AGG TGC CGC ACC 
7623 7632 7641 7650. 7659 7668 

TGG AGC ACG ACA CCG CAG GCG AGA TCG GAA CTG TCG ATC CGC TCC ACG GCG TGG 



W S TTPQARSELSIRSTAW 
GARHRRRDRNCRSAPRRG 
EHDTAGEIG TVDPLH GVA 




GCC ATG CGT GAG TGG ACA GGT GAG GGG TCA TGA AGC CTT GGC GGA GGC AGC GTC 
7677 7686 7695 7704 7713 7722 

CGG TAG GCA GTC ACC TGT CCA CTC GCC AGT ACT TCG GAA CCG CGT CCG TGG GAG 



RYALTCPLPSTSEP PPSQ 
GTHSPVHSPVLRNRLRRS 
VRTHLSTPQYFGTASVAA 

QLS*LAAAGAPSAGLQRR 

RFRDYHRPGPRPLEWSGG 
GSAI M TGRGRG.P F S GAAA 

GGG ACT TCG CTA GTA TCA CGG CGG CGG GGC CGG CCG CTT GGA GGG TCG ACG GGG 
7731 7740 7749 7758 7767 7776 

CCG TGA AGC GAT CAT AGT GCC GCG GCC CCG GCC GGG GAA GGT CCG AGC TGC CGG 

P * S D.H SA AAPAG E A P S C R 
P EA I IVPRPRPGKLPA .AA 
L KRS*CRGPGRGSSQLPP 

VCLDGAGGPSDTTGPSAP 
'v/^S V C T V P A E P A T P R G L H L R 

PCVP*RRR RPQRDDWTFG 

GCC TGT GTG TCG AGT GGC CGG GGA GGC CCG GAG AGC CAG CAG GGT CCA CTT CGG 
7785 7794 7803 7812 7821 7830 

CGG ACA CAC AGG TCA CCG GCG CCT CCG GGG CTG TCG GTC GTC CCA GGT GAA GCC 

RTHRSPAPPG LSVVPG E A 
GHT GHRR LRGC R S S Q VK P 
DT.QVTGA SGAVGRPR* SR 

RDARDGGLDRLNERIHGS 
A TPATVAWIESTKGF TGR 
PPRRP*RGFRQPKGSHA .G 

CCG GCC AGC CGG GCC AGT GGC GGG TTT AGA GAC TGC AAA AGG GCT TAG ACG GGG 
7839 7848 7857 7866 7875 7884 

GGG CGG TCG GCG CGG TCA CCG CCG AAA TCT CTG AGG TTT TCG GGA ATG TGC GCC 

GRSAR S PPKSLRFSRMCP 
GGRRGHRP NL*GFPECAP 
AVGAVTAQISEVFPN VPR 

RRN GC E S A TTA L F P P GH G 

GVIAASRHRLQSSPRAMD 
V * S Q RVG I GYNR.P L A P W T 

CTG GAT GCT AAC GGC GTG AGG CTA CGG CAT GAA CGG TGC TTC CCG CCG GGT ACA 
7893 7902 7911 7920 7929 7938 

GAC CTA GGA TTG CCG CAC TCG GAT GCC GTA GTT GCG AGG AAG GGC GGG CCA TGT 

DLRLPHSDAVVARKGGPC 
TYDCRTPMP*LRGRAGHV 
PTIAALRCRSCEEGRA (m) S 
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HE RPE*G SCTQQHGSPRA 
MNGPNEAPVRRSTVPPAP 
WT GPTRLRFVDAPSRL PP 

GGT ACA AGG GCC CCA AGA GTC GGC CTT GTG CAG ACG ACC ACT GGC CTC CCC GCC 
7947 7956 7965 7974 7983 7992 

CCA TOT TCC CGG GGT TCT CAG CCG GAA CAC GTC TGC TGG TGA CCG GAG GGG CGG 

PCSRGSQPEHV CW*PEGR 
HVPGVL SRNTSAGDRR .GG 
MFPGFSAGTRLLVTGGAG 

EDARVHDVGEQLGPGLDG 
KMPECTT SAKRSAPASTV 
S*RSARPRRRGPPRPRp* 

CGA AGT AGC CGA GCG TGC ACC AGC TGC GGA AGG ACC TCC GGC CCC GGC TCC AGT 
8001 8010 8019 8028 8037 8046 

GCT TCA TCG GCT CGC ACG TGG TCG ACG CCT TCC TGG AGG CCG GGG CCG AGG TCA 

V ASSARTWSTPSWRPGPRS 

LH RLARGRRLPGGRGRGH 
''''F IGSHVVDAFLEAGAEVT 

HQVVQGG TVRFTQVWTRD 

TSSSRVVPS GSRRSGRAT 
RAPRGSWRHGPVDPGVHP 

GGC ACG ACC TGC TGG ACT GGT GGC CAC TGG GCC TTG CAG ACC TGG GTG CAC GCC 
8055 8064 8073 8082 8091 8100 

CCG TGC TGG ACG ACC TGA CCA CCG GTG ACC CGG AAC GTC TGG ACC CAC GTG CGG 

PCWTT*PPVTRNVWTHVR 
RAGRPDHR*PGTS.GPTCG 
VLDDLTTGDPERLDPRAV 

DT ADVHGIGGGQVLGHPR 
MRR T S T V S AAAR S S A T R D 

GDRRRSRHRRGPRP RAT 

AGT AGG CAG CGC AGC TGC ACT GGC TAC GGC GGC GGG ACC TGC TGC GGC ACG CCA 
8109 8118 8127 8136 8145 8154 

TCA TCC GTC GCG TCG ACG TGA CCG ATG CCG CCG CCC TGG ACG AGG CCG TGC GGT 

SSVAST*PMPPPWTRPCG 
HPSRRRDRCRRPGRGRAV 
IRRVDVTDAAALDEAVRS 

RAGVDDAMERGLDVDPDR 
ARGSTMQWRAAWI STRTE 
PAGRR*RGDRPG SRR GPR 

GCC GCG CGG GGC TGC AGT AGA CGG TAG AGC GCC GGG TCT AGC TGC AGG CCC AGA 
8163 8172 8181 8190 8199 8208 

CGG CGC GCC CCG ACG TCA TCT GCC ATC TCG CGG CCC AGA TCG ACG TCC GGG TCT 
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R- R A- p..,.T • ' S*-- ' A> r S- R " P-- R S- • T ' S G S 

GAPRRHLPSRGPDRRPGL 
ARPDVICHLAAQI DVRVS 

HGCRGDVRPDVDLARDVF 
TAVGATSARTLTS PVILT 
PPWVPRRRAP*RRPCS *R 

GCC ACC GGT GTG GCC GGC AGC TGC GCG CCC AGT TGC AGC TCC CGT GCT AGT TGC 
8217 8226 8235 8244 8253 8252 

CGG TGG CCA CAC CGG CCG TCG ACG CGC GGG TCA ACG TCG AGG GCA CGA TCA ACG 

RWPHRPSTRGSTSRARST 
GGHTGRRRAGQRRGHDQR 
VATPAVDARVNVEGTIN\ 

QFRRVGDPRPDHE GGG Ai 
SSAACATPARTTNAEVPP 
APLPARRRPAPRTRRWR R 

ACG ACC TTC GCC GCG TGC GGC AGC CCC GCG CCC AGC ACA AGC GGA GGT GGC CGC 
8271 8280 8289 8298 8307 8316 

^^^I^GC TGG AAG CGG CGC ACG CCG TCG GGG CGC GGG TCG TGT TCG CCT CCA CCG GCG 

^'^^i-- . ■ 

C WKRRT P S GR.GSC S PP PA 
AGS GARRRGAGRVRLHRR 
LE AAHAVGARV VFASTGG 

REVPFANRDRRVLVR QGr 
AS*PSPTGTGVFS SVSGL 
PARRPLRE PGSSRPCAA W 

CCC GCG AGA TGC CCC TTC CGC AAG GCC AGG GCT GCT TGC TCC TGT GCG ACG GGT 
8325 .8334 8343 8352 8361 8370 

GGG CGC TCT ACG GGG AAG GCG TTC CGG TCC CGA CGA ACG AGG ACA CGC TGC CCA 

GR STGKAFRSRR TRTRCP 
G ALRGRRSGPDERGHAAQ 
ALYGEGVPVPTNEDTLPR 

RPRGVARGLVARLLVDAQ 
G P A G * P V A L Y Q A S F Y M P R 
APPARRCPWTSRP S TCRG 

CCG GCC CCC GCG GGA TGC CGT GCC GGT TCA TGA CGC GCC TCT TCA TGT AGC CGG 
8379 8388 8397 8406 8415 8424 

GGC CGG GGG CGC CCT ACG GCA CGG CCA AGT ACT GCG CGG AGA AGT ACA TCG GCC 

GRGRP T AR P S TA,R R S T SA 
AGGALRHGQVLRGEVHRP 
PGAPYGTAKY CAEKYIGL 

EVPQVSGLVAHQPEAVHV 
N L R S C P V S C L T N R S P L T Y 

T*GAARFRACRTAARCRT 



ACA AGT TGG CCG ACG TGC CTT GGC TCG TGT CGC ACA ACG CCG AGC CGT TGC ACA 
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8433' 8442-' 8457 • 8'460 ^469 ' 8478 

TGT TCA ACC GGC TGC ACG GAA CCG AGC ACA GCG TGT TGC GGC TCG GCA ACG TGT 



CSTGCTEPSTACCGSATC 
VQPAARNRAQRVAARQRV 
FNRLHGTEHSVLRLGNVY 

PGPL ARATLRADDGD VAP 
PGRCLGPPSAPTMAM*QP 
R AGASGPRHPPR*RWRSR 

TGC CCG GGG CCG TCT CGG GCC CGC CAC TCC GCC CGC AGT AGC GGT AGA TGA CGC 
8487 8496 8505 8514 8523 8532 

ACG GGC CCC GGC AGA GCC CGG GCG GTG AGG CGG GCG TCA TCG CCA TCT ACT GCG 

TGPGRARAVRRASSP STA 
RAPAEPGR*GGRHRHLLR 
GPRQSPGGEAGVIA lY CG 

QGGLAS HGRHEAVT R L GT 
SAESPPTGVTNPSPECVR 
^-A P R R P R L A W P T R.R R N A S G 

Ml" - 

TCCG ACC GGA GGC TCC CGC CTC ACG GGT GCC ACA AGC CGC TGC CAA GCG TCT GGG 
8541 8550 8559 8568 8577 8586 

GGC TGG CCT CCG AGG GCG GAG TGC CCA CGG TGT TCG GCG ACG GTT CGC AGA CCC 

GWPPRAEC PRCSATVRRP 
AGLRGR SA HGVRRRFA DP 
LASEGGVPTVFGDGSQTR 

VVHVDAVDGRREDRRVAG 
S*TYTPSTAAAN TAGYPV 
H SRTRRRR RRPTRRATRC 

CAC TGA TGC ACA TGC AGC CGC TGC AGC GGC GCC GCA AGC AGC GCG GCA TGC CGT 
8595 8604 8613 8622 8631 8640 

GTG ACT ACG TGT ACG TCG GCG ACG TCG CCG CGG CGT TCG TCG CGC CGT ACG GCA 

TTCTSATSPRRSSRRTA 
^ L R V R R R R R R G V R R A V R H 
D Y V Y V G D V A A A F V A P Y G T 

DA RRR S CRVRAL P A R HQ L 
TPGADPVDSVPL PLVTSS 
RRGP TQ FMPCPCP S C PAP 

GGC AGC CGG GCC GCA GAC CTT GTA GCC TGT GCC CGT TCC CCT CGT GCC ACG ACC 
8649 - 8658 8667 8676, 8685 8694 

CCG TCG GCC CGG CGT CTG GAA CAT CGG ACA CGG GCA AGG GGA GCA CGG TGC TGG 

PSARRLEHRTRARGARCW 
RRPGVWNIGHGQGEHGAG 
VGPASGTSDTGKGS TVLE 

DEVVDGGGGPAVQRGTER 
TRSWMAA AEPRSR.GGRKA 
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TCC AGG AGC TGG TGT AGC GGC GGC GGA GGC CCG CGC TGG ACG GAG GGG CAA AGC 
8703 8712 8721 8730 8739 8748 

AGG TCC TCG ACC ACA TCG CCG CCG CCT CCG GGC GCG ACC TGC CTC CCC GTT TCG 

RSSTTSPPPPGATCLPVS 
GPR PHRRRLRARPASPFR 
VLDHIAAASGRDLPPRFA 

GAPRALDLVAGQVDSTDG 
GRRGPSIWCLVRSTVRTA 
AGGAPR S GACC GPR * E HR 

GCG GGG CGG CCG GCC CGC TCT AGG TCG TGT CGT GGG ACC TGC AGT GAG CAC AGC 
8757 8766 8775 8784 8793 8802 

CGC CCC GCC GGC CGG GCG AGA TCC AGC ACA GCA CCC TGG ACG TCA CTC GTG TCG 

RPAGRARSSTAPWTSLVS 
APPAGRDPAQHPGRHSCR 
PRRPGE IQHSTLDVTRVA 

i^Bf GIQAPGRGDRQLFADGGG 
'T^' ASRP QVADTGSSFPMAA V 
iRRDPSSRTRGAPSLCRRW 

GGC GGC TAG ACC CGA CCT GGC GCA GGC AGG GCG ACC TCT TTC CGT AGC GGC GGT 
8811 8820 8829 8838 8847 8856 

CCG CCG ATC TGG GCT GGA CCG CGT CCG TCC CGC TGG AGA AAG GCA TCG^ CCG CCA 

IWAGPRP SRW RKA S P P 
RRSG LDRVRPAGERHRRH 
ADLGWTASVPLEKGIAAT 

VGPDTGTRGDPLL C S * SA 
*AQTREPEGTRCCAHS VQ 
RRRPGNRNARGAAPMVLK 

( ;j GGA TGC GGA CCC AGG CAA GGC CAA GCG GGC AGG CCG TCG TCC GTA CTG ATT GAA 
14(1^ 8865 8874 8883 8892 8901 8910 

^CCT ACG CCT GGG TCC GTT CCG GTT GGC CCG TCC GGC AGC AGG CAT GAC TAA CTT 

PTPGSVPVRPSGSRHD*L 
LRLGPFRFARPAAGMTNL 
YAWVR S G .S PVRQ QA * L T C 

CACCSDTASA SRPPPGTC 
AP AAPTRPRRRDRHRGRV 
RLRLLLGHGVGI. ATAAGY 

CGC GTC CGC GTC GTC CTC AGG CAC CGG CTG CGG CTA GCG CCA CCG CCG GGG CAT 
8919 8928 .8937 8946 8955 8964 

GCG CAG GCG CAG CAG GAG TCC GTG GCC GAC GCC GAT CGC GGT GGC GGC CCC GTA 

AQAQQES VADADRGGGPV 
RRRSRSPWPT PIAVAAPY 
AGAAGVRGRRRSRWR'PRT 
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ASC CHHAARSRRPAT GP * 
RLVATTHLAVGARHPAPD 
VCFLLPTCRSEPATRHRT 

GTG CGT CTT GTC GTC ACC ACA CGT CGC GCT GAG GCC GCG CCA CGC CAC GGC CCA 
8973 8982 8991 9000 9009 9018 

CAC GCA GAA CAG CAG TGG TGT GCA GCG CGA CTC CGG CGC GGT GCG GTG CCG GGT 

HAEQQW CAARLRRGAVPG 
TQNSS GVQRDSGAVRC RV 
RRTAVVCSATPARCGAGS 

SRASDRRRSTGDRRRVCG 
AGQPT GGGVPATAGGFAG 
LEKR L GAASQHRRA E S RV 

GTC GAG GAA CGC CTC AGG GCG GCG GCT GAC CAC GGC AGC GCG GAG GCT TGC GTG 
9027 9036 9045 9054 9063 9072 

CAG CTC CTT GCG GAG TCC CGC CGC CGA CTG GTG CCG TCG CGC CTC CGA ACG CAC 

_ Q L L A E S R R R L V P S R L R T H 
SSLRSPAADW CRRASERT 
APCGVPPPTGAVAPPNAP 

ALLGPAP PLP PHAPRPRC 
QWYARRLLYRLTLRGPDV 
R G T P GAC ST ASP SGAP T S 

GGA CGG TCA TCC GGG CCG CGT CCT CCA TCG CCT CCC ACT CGG CCG GCC CCA GCT 
9081 9090 9099 9108 9117 9126 

CCT GCC AGT AGG CCC GGC GCA GGA GGT AGC GGA GGG TGA GCC GGC CGG GGT CGA 

PASRPGAGGSGG*AGRGR 
L PVGPA QEVAEGEPAGV D 
CQ*ARR RR*RRV S R P G S T 

RPR GRARAAPL ERA GAE K 
D HVVAHEPLL CS ARVRRR 
^TSSRTSPCCAA R ACGGG 

GTA GCA CCT GCT GGC GCA CGA GCC CGT CGT CCG TCG AGC GCG CGT GGG CGG AGG 
9135 9144 9153 9162 9171 9180 

CAT CGT GGA CGA CCG CGT GCT CGG GCA GCA GGC AGC TCG CGC GCA CCC GCC TCC 

HRGRPRARAAGSSRAPAS 
I VDDRVLGQQAARAH-P PP 
SWTTACSGSRQLARTRL. L 

ML AIF STDEGSQLNVGTR 
**RSSPPTRVPS CTSAPA 
EDARHLLHG*RVAPQRRH 

AAG TAG TCG CGC TAC TTC CTC CAC AGG AGT GGC CTG ACG TCC AAC TGC GGC CAC 
9189 9198 9207 9216 9225 9234 

TTC ATC AGC GCG ATG AAG GAG GTG TCC TCA CCG GAC TGC AGG TTG ACG CCG GTG 
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SSAR*RRCPHRTAG*RRC 
HQRDEGGVLTGLQVDAGA 



SLDLDFTLGQRRAFDADV 
A*TWTSPSARAARSTPTS 
PEP GPRLHPGP PARLRRR 



GCC GAG TCC AGG TCC AGC TTC CAC TCC GGG ACC GCC GCG CGC TTC AGC CGC AGC 
9243 9252 9261 9270 9279 9288 

CGG CTC AGG TCC AGG TCG AAG GTG AGG CCC TGG CGG CGC GCG AAG TCG GCG TCG 



RLRSRSKVRPWR RAKSAS 
GSGPGRR* GPGGARSRRR 
AQVQVEGEALAAREVGVD 

G MCAGWIKID GRDRHWGV 
A ''^'^^ PAGSRSTGATATGAS 

RG,3iLRGLDQHGRPRPALR 



TGC^ <3(3G GTC CGC GGG GTC TAG AAC TAC AGG GGC GCC AGC GCC ACG GTC GGC 

9297 9306 9315 9324 , 9333 9342 

' Jfii^i^^ CCC ATG CAG GCG CCC CAG ATC TTG ATG TCC CCG CGG TCG CGG TGC CAG CCG 

.Jg^rf- --- 

/ T PMQ AP Q I L MSPR S R C QP 
R^PCRRPRS*CPRGRGASR 
AHAGAPDLDVPA VAVPAD 

L HF Q G S S LFWP L RR L E R P 
STSSGRPCSGPCGASSER 
RPPVAGLVPVLAAPPARA 



TGC TCC ACC TTG ACG GGG CTC CTG TCC TTG GTC CCG TCG GCC GCC TCG AGA GCG 
9351 9360 9369 9378 9387 9396 

ACG AGG TGG AAC TGC CCC . GAG GAC AGG AAC CAG GGC AGC CGG CGG AGC TCT CGC 



T -RWNCPEDRNQGSRRS SR 
RGGT APRTG TRAAGGALA 




R D C G R V S W T R G P A S R P A S 



ATAAACRGRAG.RRPVRRP 



CCG CCA GCG TCG GCG CGT GGC TGG TGC ACG CGG GGC CGC GCC TTG CGC CGC GCC 
9405 9414 9423 9432 9441 9450 

GGC GGT CGC AGC CGC GCA CCG ACC ACG TGC GCC CCG GCG CGG AAC GCG GCG CGG 



GGRSRAPTTCAP.ARNAAR 
A VAAA HRPRAPR RGTRRG 
RSQPRTDHVRPGAERGAD 

ADVASAELRVDDDVFLVH 
PTWPPPRWGCTTTWSCCT 
RRGRRL GGAARRRGRVAR 

TGC CGC AGG TGC CGC CTC CGG AGG TCG GCG TGC AGC AGC AGG TGC TTG TCG TGC 
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9459 9468 9477^ ' * 94'86 • 9495 9504 

ACG GCG TCC ACG GCG GAG GCC TCC AGC CGC ACG TCG TCG TCC ACG AAC AGC ACG 



TASTAEASSRTSSSTNST. 
RRPRRRPPAARRRPRTAR 
GVHGGGLQPHVVVHEQHV 

RDAWERLVTN RSAS LGRT 
GTPGNGCCRTVPRRCGER 
APRGMGAAGH*PVGVARA 

ACG GCC AGC CGG GTA AGG GCG TCG TGG CAC AAT GCC CTG CGG CTG TCG GGA GCG 
9513 9522 9531 9540 9549 9558 

TGC CGG TCG GCC CAT TCC CGC AGC ACC GTG TTA CGG GAC GCC GAC AGC CCT CGC 

CRSAH SRSTVLRDADSPR 
AGRP IPAAPCYGTPTALA 
I'VGPFPQHRVTGRRQ PSR 

AGL I RMTGGAENVQTAVK 
PGWSGCRGGPRT*RPPSR 

HGGPDADDGRGREG PHRG 

./^.Jk- 

^WtiM " " 

jpVCAC CGG GGG TCC TAG GCG TAG CAG GGG GGC CGG AGC AAG TGG ACC CAC CGC TGG 
^ 9567. 9576 9585 9594 9603 9612 

GTG GCC CCC AGG ATC CGC ATC GTC CCC CCG GCC TCG TTC ACC TGG GTG GCG ACC 

VAPR IRIVPPAS FTWVAT 
WPPGSASSPR. PRSPGWRP 
G PQDPHRPPGLVHLGGDL 

EAEPTVPRDLLVVYEDGN 
RPRLH*RGTWCCSTNTVT 
ERG*TDGAPGAARRIR *R 

AAG AGC CGG AGT CCA CAG TGG CCG GCC AGG TCG TCG TGC TGC ATA AGC AGT GGC 
9621 9630 9639 9648 9657 9666 

TTC TCG GCC TCA GGT GTC ACC GGC. CGG TCC AGC AGC ACG ACG TAT TCG TCA CCG 

^^Jl^ SAS GVTGRSSSTTYSSP 
^•^^ S R P Q V S P A G P A A R R I R H R 
L G L R C H R P V Q Q H D V F V T V 

LQDLNHRLH RRVNELRFA 
*STSTTGC IGASTRWVSP 



EVPRPQAASAPPREGSP 



L 



AAG TTG ACC AGC TCC AAC ACG GCG TCT ACG GCC GCC TGC AAG AGG TCT GCC TTC 
9675 9684 9693 9702... 9711 9720 

TTC AAC TGG TCG AGG TTG TGC CGC AGA TGC CGG CGG ACG TTC TCC AGA CGG AAG 

FNWSRLCRRCRRTFSRRK 
STGRGCAADAGGRSPDGR 
QLVEVVPQMPADVLQTEG 

C V A V V (m) PRRGPTNRDA TE 
VSRWWV/QVGGPPTGTRLR^ 
4^ -38- 
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CGT GTC TGG CGG TGG TGG TAA OCT GCG GCG GGC CCC CAC AAG GCC AGG CGT GAG 
9729 9738 9747 9756 9765 9774 

GCA GAG ACC GCC ACC ACC ATT GGA CGC CGC CCG GGG GTG TTC CGG TCC GCA GTC 

AQTA TT IGRRPGVFRSAV 
HRPP P P LDAARGC S GP Q S 
TDRHHHWTPPGGVPVR SL 

KKDVTVGTHSREAPPPVR 
KRTWL*ELIAANRRRPCE 
REQGCDSWYPQTGGAPAS 

AGA AAG AAC AGG TGT CAG TGA GGT CAT ACC GAC GCA AGG CGG CCG CCC CCG TGA 
9783 9792 9801 9810 9819 9828 

TCT TTC TTG TCC ACA GTC ACT CCA GTA TGG CTG CGT TCC GCC GGC GGG GGC ACT 

SFLSTVTPVWLRSAGGGT 
LSCPQSLQYGCVP PAG AL 
FLVHSHS SMAAFRRRGHS 

fj:f SH*DDNMTRVAK*S IH*L 

iVJ/i R T . D T T M * R V F Q K R L F T S F 
AL TLR*EDYSSSELFHAL 

GCG CTC ACA GTC AGC AGT AAG TAG CAT GCT TGA CGA AAG ATT CTT TAC ACG ATT 
9837 9846 9855 9864 9873 9882 

CGC GAG TGT CAG TCG TCA TTC ATC GTA CGA ACT GCT TTC TAA GAA ATG TGC TAA 

R E C Q S S F I VR TA F * E M C * 
ASVSRHSSY ELLSKKCA K 
RVSVVIHRTNCF LRNVLK 

I PPE SRMPATLR SADA* W 
FRRSRGCQRQ*DR LTPRG 
SDAAGVA NASNTEFRRGV 

TCT TAG CCG CCG AGG CTG GCG TAA CCG CGA CAA TCA GAG CTT CGC AGC CGG ATG 

J\ 9891 9900 9909 9918 9927 9936 

^ GA ATC GGC GGC. TCC GAC CGC ATT GGC GCT GTT AGT CTC GAA GCG TCG GCC TAC 



RIGGS DRIGAVSL EASAY 
E SAAPTALALLVSKRRPT 
.NR RLR .PHWRC*SRSVGLP 

FSQVP'SPHQFCPAENPRI 
SRSSLHPI NSAPRRMRAF 
LVVP C T L STP LL. A G * E P S 

GTC TTG CTG ACC TGT CCA CTC CCT ACA ACC TTC GTC CCG CGG AGT AAG CCC GCT 
9945 9954 9963 9972 9981 9990 

CAG AAC GAC TGG ACA GGT GAG GGA TGT TGG AAG CAG GGC GCC TCA TTC GGG CGA 

QNDWTGEGCWKQGAS FGR 
R T T G Q V R D,,^ VGSRAPHSGE 
E R L D R * G LEAGRLIRAN v^/O 
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VRHQGIAAGDGELLDVTS 
SGTSV* RPATERWST SPP 
HGPASRDRRRRGGPPRRH 

TAG TGG GCC ACG ACT GGA TAG CGC CGC GGC AGA GGG AGG TCC TCC AGC TGC CAC 
9999 10008 10017 10026 10035 10044 

ATG ACC CGG TGC TGA CCT ATC GCG GCG CCG TCT CCC TCC AGG AGG TCG ACG GTG 

MTRC*PIAAPSPSRRSTV 
* PGADL SRRRLPPGGRR W 
D PV LTYRGAVSLQEVDGG 

YRGPSYRKLFPVQEKGLi^ 
lAGQRI GK*S RCRNKGSP 
FLARAFVKEPVAGTRERP 

CTT ATC GCG GGA CCG CTT ATG GAA AAG TCC TTG CCG TGG ACA AGA AAG GGC TCC 
10053 10062 10071 10080 10089 10098 

GAA TAG CGC CCT GGC GAA TAC CTT TTC AGG AAC GGC ACC TGT TCT TTC CCG AGG 

E *RPGEYLFRNGTCS F PR 
SALANTFSGTAPVL SRG 
rfi^^^ lAPWRIPFQERHLFFPEG 

A HSAGRHRRP HPDSE PGV 
PTPRAA IGVPTRTVKRVS 
RRPVRRSA SPPAP*KGSR 

CGC CGC ACC CTG CGC GGC GCT ACG GCT GCC CCC ACG CCC AGT GAA AGG CCT GGC 
10107 10116 10125 10134 10143 10152 

GCG GCG TGG GAC GCG CCG CGA TGC CGA CGG GGG TGC GGG TCA CTT TCC GGA CCG 

AAWDAPRC RRGCGSL S GP 
R R GT R R DAD GGA G H F P D R 
GV GRAAM PTGVRVTFRTD 

GLPECEPVRG.TRGGLHRA 
•^A S P S A N R YA AR G A G S I G P 
^^RRPARM.GTRPGDQGR S AP 



TGC GGC TCC CCG AGC GTA AGG CCA TGC GCC GGG CAG GAC GGG . GGC TCT ACG GCC 
10161 10170 10179 10188 10197 10206 

ACG CCG AGG GGC TCG CAT TCC GGT ACG CGG CCC GTC CTG CCC CCG AGA TGC CGG 

TPRGSHSGTRPVLPP RCR 
RRGARI PVRGPSCPRDAG 
AEGLAFR YAARPAPEMPG 

RGLRRVDVY SH VALRDGA 
GGSVACTS'TRTSPLGTAL 
GARSPARRRVLPRCAPR.W 

CGG GCG GGC TCT GCC GCG TGC AGC TGC ATG CTC ACC TGC CGT TCG GCC AGC GGT 
10215 10224 10233 10242 10251 10260 

GCC CGC CCG AGA CGG CGC ACG TCG ACG TAC GAG TGG ACG GCA AGC CGG TCG CCA 
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PARDGARRRTSGRQAGRQ 
PPETAHVDV RVDGKPVA2 

EGQHGVPLDVRAPDP CQI 
RGRTVSRSTWVHR TPASG 
GGGPSRGPPGCTGPRPVA 

CGG AGG GGG ACC ACT GGC TGG CCC TCC AGG TGT GCA CGG CCC AGC CCC GTG ACG 
10269 10278 10287 10296 10305 10314 

GCC TCC CCC TGG TGA CCG ACC GGG AGG TCC ACA CGT GCC GGG TCG GGG CAC TGC 

ASPW*PTGRSTRAGSGHC 
PPP GDRPGGPHVPGRGTA 
LPLVTD REVHTCRVGAL] 

AAAVAKHLQPQGAQVLEI 
PPLSRRTSSHSGPRFWNT 
PRCRGGQPATAAR GSGTR 

GCC CGC CGT CGC TGG CGG AAC ACC TCG ACA CCG ACG GGC CGG ACT TGG TCA AGC 
10323 10332 10341 10350 10359 10368 

^^jl^^GG GCG GCA GCG ACC GCC TTG TGG AGC TGT GGC TGC CCG GCC TGA ACC AGT TCG 

^ RAAATALWSCGCP A*TSS 
GRQRPPCGAVAARPEPVR 
GGSDRLVELWLPGLNQFT 

QVAHL*RCAGLHAPVGM< 
R C P T S N G A P A S T P R S V W V 
GARRPTVPLRRP PGPCGY 

AGG ACG TGC CGC ACC TCA ATG GCC GTC CGC GGC TCC ACC CGG CCC TGT GGG TAT 
10377 10386 10395 10404 10413 10422 

TCC TGC ACG GCG TGG AGT TAC CGG CAG GCG CCG AGG TGG GCC GGG ACA CCC ATA 

SCTAWSYRQA PRWAGTP I 

p ar r g v t grr r g g p g h p y 
% hg. ve l p a GA EV G R D T H 

1 



R G A P D V V P G G L R L A S P R ? 
A G R Q T W * P A E S D C P L PAS 
RAGSPGSRPRRTAPCLPA 

GGC GCG GGG CGA CCC AGG TGA TGC CCC GGA GGC TCA GCG TCC CGT CTC CCC GCG 
10431 10440 10449 10458 10467 10476 

CCG CGC CCC GCT GGG TCC ACT ACG GGG CCT CCG AGT CGC AGG GCA GAG GGG CGC 

PRPAGSTTGPPSRRAEGR 
RAPLGP L RGLRVAGQRG A 
APRWVHYGASESQGRGAI 

RGGPVPGRGD GGFEPQVC 
DGVRFQVA .VTAVS SP S S R 
TAWGSSSRSRRWR VRAPG 



ACA GCG GGT GGG CCT TGA CCT GGC GCT GGC AGC GGT GGC TTG AGC CCG ACC TGG 
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TGT CGC CCA CCC GGA ACT GGA CCG CGA CCG TCG CCA CCG AAC TCG GGC TGG ACC 



CRPPGTGPRPSPPNSGWT 
VAHPELD 'RDRRHRTRAGP 
SPTRNWTATVATELGLDL 

GRQRDPR AAVELREERGQ 
VESAIPAPQ*RWGSKAVR 
SRAPSRPPSSGGAARRSG 

ACT GGA GCG ACC GCT AGC CCC GCC CGA CGA TGG AGG TCG GCG AGA AGC GCT GGG 
10539 10548 10557 10566 10575 10584 

TGA CCT CGC TGG CGA TCG GGG CGG GCT GCT ACC TCC AGC CGC TCT TCG CGA CCC 

*PRWRSGRAATS SRS SRP 
.D LAGDRGGLLPPAALRDP 
TSLAIGAGCYLQPLFATL 

EAVQGG I QDRAHDAHV.D I 
SRSRGASRIVHMTPM FM* 
.^AGRGARRDS* TC PRC S CR 
^ 

AGG CGC TGG ACG GGC GGC TAG ACT AGT GCA CGT ACC AGC CGT ACT TGT AGA 
10593 10602 10611 10620 10629 10638 

TGC TCC GCG ACC TGC CCG CCG ATC TGA TCA CGT GCA TGG TCG GCA TGA ACA TCT 

• C S A T C P P I * S RA W S A * T S 
APRPARRSDHVHGRHEHL 
LRDLPAD LITCMVG MNI Y 

ARTGQVLEGVPRVQDPQD 
PARARFWNV*RGFR TP ST 
HR AH G S G T *R GA S G P R A P 

TAC CGC GCG CAC GGG ACT TGG TCA AGT GGA TGG CCG GCT TGG ACC AGC CCG ACC 
10647 10656 10665 10674 10683 10692 

ATG GCG CGC GTG CCC TGA ACC AGT TCA CGT ACC GGC CGA ACC TGG TCG GGC TGG 

J^^yiARVP * T SSPTGRTW S GW 
, W R A C P E P V H L P A E P G R A G 

G A R A L N Q F T Y R P N L V G L V 

PD DPL S VGRGRQDDRG VV 
RIMRSRCGEVGSTMADWW 
GS*GPAVGRSGAP*RTGG 

AGG CCT AGT AGG CCC TCG CTG TGG GGA GCT GGG GCG ACC AGT AGC GCA GGG TGG 
10701 10710 10719 10728.. 10737 10746 

TCC GGA TCA TCC GGG AGC GAC ACC CCT CGA CCC CGC TGG TCA TCG CGT CCC ACC 

SGSSGSDTPRPRWSSRPT 
PDHP GA TPLDPA GHR V P P 
RIIRERHPSTPLVIASHH 

VRGPVVRQFSVAVQGQRL 
*EGQC SGSSPSP*RDKVS 
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TGA TGA GCG GGA COG TGC TOG GCG AGO TTC CTC TGC CGA TGG ACA GGA ACT GCC 
10755 10764 10773 10782 10791 10800 

ACT ACT CGC CCT GGC ACG ACC CGC TGG AAG GAG ACG GCT ACC TGT CCT TGA CGG 



TTRPGTTRWKETATCP *R 
LLAL ARPAGRRRLPVLDG 
YSPWHDPLEGDGYLSLTE 

DPLLGTLHDIQQARVAVL 
TRSCVRSTTSRSRASPSS 
PGPASGHPPRDAARPRRR 

TCC AGG CGC TCG TCT GGG CAC TGC ACC AGC TAG ACG ACG CGC GCC TGC CGC TGC 
10809 10818 10827 10836 10845 10854 

AGG TCC GGG AGC AGA .CCC GTG AGG TGG TCG ATC TGC TGC GCG CGG ACG GCG ACG 

RSGSRPVRWSICCARTAT 
GPGADP * GGRSA ARGRRR 
V REQTREVVDLLRADGDE 

VDVVDVARAEGAGFGGVQ 
"Jfp . F TW*TWPGLRA PGSVAWR 
r S R G S R G R G S GRR G R F R G G 

TCT TGC AGG TGA TGC AGG TGC CGG GCT CGG AGC GGC CGG GGC TTT GGC GGG TGG 
10863 10872 10881 10890 10899 10908 

AGA ACG TCC ACT ACG TCC ACG GCC CGA GCC TCG GCG GCC CCG AAA CCG CCC ACC 

RT ST T S T ARA SP A P K P P T 
ERPLRPRPEPRRPRNRPP 
NVHYVH GPSL AGPETAHL 

VDLRPVGIRQVEVLLPVV 

Y T S G R Y VSGSCKLWSPCS 
TRRAATCRDAAS *GPPAR 

• ACA TGC AGC TCG GCG CCA TGT GGC TAG GCG ACG TGA AGT TGG TCC TCC CCG TGC 
\ 10917 10926 10935 10944 10953 10962 

^"^^ '^^^ ^^'^ ATC CGC TGC ACT TCA ACC AGG AGG GGC ACG 

C T S S R G T P I R C T S T R R G T 

V RRA AV H R SAAL Q P G G A R 
YVEPRYTDPLHFNQEGHD 

QQRGSE LPLEHLQHRVQH 
RSAAAKWRFSTSSTGSRT 
GAPPRKGASARPAPAPGP 

TGG ACG ACC GCC GGC GAA AGG TCG CCT TCG AGC ACC TCG ACC ACG GCC TGG ACC 
10971 10980 10989 10998 11007 11016 

ACC TGC TGG CGG CCG CTT TCC AGC GGA AGC TCG TGG AGC TGG TGC CGG ACC TGG 

TCWRPLSSGSSWSWCR TW 
PAGGRFPAEARGAGAGPG 
LLAAAFQRKLVELVPDLV 
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PGSERVRGALCQPDLFGI 
RDQSGSEGRLASRI *SGA 
ATRVGPSEGCPVASRPVR 

ACG CCA GGA CTG AGG GCC TGA GAG GGG CGT TCC GTG ACG CCT AGA TCC TTG GGC 
11025 11034 11043 11052 11061 11070 

TGC GGT CCT GAC TCC CGG ACT CTC CCC GCA AGG CAC TGC GGA TCT AGG AAC CCG 

CGPDSRTLPARHCGSRNP 
AVLTPGLSPQGTADLGTR 
RS*LPDSPRKALRI*EPi 

VYRTSPRIGRCRRHTRSi 
STDPPHDSGEADGI .HGPL 
PRIPHI T PDRQMASTDPF 

GCC TGC ATA GCC CAC CTA CCA GCC TAG GGA GAC GTA GCG GCT ACA CAG GCC CTT 
11079 11088 11097 11106 11115 11124 

CGG ACG TAT CGG GTG GAT GGT CGG ATC CCT CTG CAT CGC CGA TGT GTC CGG GAA 



RTY RVDGRIPLHRRCVRE 
^^/G RIGWMVGSLCIADVSGK 
'ifiP^ DVSGGWSDPSASPMCPGi 

RPRLCGTRGSS .PIRGRAI 
GHAFAVLGAQLRSEVGLK 
G .TPSPL WDPRFVPNSGSS 

CGG GCA CCC GCT TCC GTT GGT CAG GCC GGA CTT CTG CCC TAA GCT GGG GCT CGA 
11133 11142 11151 11160 11169 11178 

GCC CGT GGG CGA AGG CAA CCA GTC CGG CCT GAA GAC GGG ATT CGA CCC CGA GCT 

ARGRRQPVRPEDGIRPRA 
PVGEGNQSGLKTGFDP.EL 
P WA KA T S PA* RRD S T P S I 

GT DPGYSGQRHA RHGRAi 

ALIQAMHAKVTRETVGL L 

^R WYRPWILRSPASPSGSC 
^ . .„ . . 

AGC GGT CAT AGA CCC GGT ATA CTC GGA ACT GCC ACG CGA GCC ACT GGG GCT CGT 
11187 11196 11205 11214 11223 11232 

TCG CCA GTA TCT GGG CCA TAT GAG CCT TGA CGG TGC GCT CGG TGA CCC CGA GCA 

SPVSGPYE ,P*RCAR*PRA 
RQYLGHM'SL DGALGDPEQ 
ASIWAI *ALTVRSVTPSS 

RRD*PQLLRPEAPPLGP7 
AAIERNSY GHSLLLFVQL 
RPSRVTPTATA*CSSSRS 

CGC GCC GCT AGA GTG CCA ACC TCA TCG GCA CCG AGT CGT CCT CCT TCT GGA CCT 
11241 11250 11259 11268 11277 11286 

GGG CGG CGA TCT CAC GGT TGG AGT AGC CGT GGC TCA GCA GGA GGA AGA CCT GGA 
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RGDLT VGVAVAQQEE DLE 
AAISRLE*PW LSRRKTWS 

RPRLTFTGPQARGALPVP 
ERDSLLHVQSLGELWPFQ 
SA TPSY lYRAS GKWGP SS 

CGA GCG CCA GCC TCT CAT TTA CAT GGA CCG ACT CGG GAA GGT CGG TCC CCT TGA 
11295 11304 11313 11322 11331 11340 

GCT CGC GGT CGG AGA GTA AAT GTA CCT GGC TGA GCC CTT CCA GCC AGG GGA ACT 

ARGRR VNVPG*ALPARGT 
L A V G E * M Y L A E P F Q P G E L 
SRSESKCTWLSPSSQGNW 

GRPSI SRRWF*QFR LR FI 
DEH LFRDDGSDSSDC GSY 
TRTSFDITA LIVPIAAPI 

CCA GGA^ GCA CCT CTT TAG CTA GCA GCG GTC TTA GTG ACC TTA GCG TCG GCC TTA 
11349 11358 11367 11376 11385 11394 

^GT CCT CGT GGA GAA ATC GAT CGT CGC CAG AAT CAC TGG AAT CGC AGC CGG AAT 

. 

^"G.P R G E I D. R R Q N H W N R S R N 
V L V E K S I V. AR I T G I A A G I 
SSWRNRSS PESLESQP EY 

AFDPGRILTHDKCARL P* 
PLTQGGYSRTTRAHG L D 
HCLRAGTHAHPGQMG* ST 

TAC CGT TTC AGA CCG GGG GCA TAG TCG CAC ACC AGG AAC GTA CGG GAT TCT CCA 
11403 11412 11421 11430 11439 '11448 

ATG GCA AAG TCT GGC CCC CGT ATG AGC GTG TGG TCC TTG CAT GCC CTA AGA GGT 

M A K S G P R MSVWSLHALRG 
WQ SLAPV*ACGP CMP * E V 
GKVWP PYERVVLACPKR S 

^Jff" GVCRTDLRRLAGGSF* SS 

" D S A D- 1- i A - G F P A V -V S S H- - L- 

M R R M S Y * P A S P R W W Q V I F 

GTA GGC TGC GTA GCT CAT AGT TCC GCG GCT TCC CGC GGT GGT GAC TTG ATA CTT 
11457 11466 11475 11484 11493 11502 

CAT CCG ACG CAT CGA GTA TCA AGG CGC CGA AGG GCG CCA CCA CTG AAC TAT GAA 

HPTHRVS RRRR APPLNYE 
I R R I E Y Q G A E G R H H * T M K 
SDASS I K APKGATTE L *R 

TLAIGGMRRIPGPC* EDQ 
RSPSVVWAVFPDQVNSMK 
VHPRYWGHSSHTRSMV*R 



CTG CAC TCC CGC TAT GGT GGG TAC GCT GCT TAC CCA GGA CCT GTA ATG AGT AGA 
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fl Sn-- I f 520"^ rT529^ - 11538 ' 1 rS47 " " ' 11556 

GAC GTG AGO GCG ATA CCA CCC ATG CGA CGA ATG GGT CCT GGA CAT TAG TCA TCT 

DVR AIPPMRRMGPGHYSS 
T*GRYHPCDEWVLDI THL 
REGDTTHATNGSWTLLII 

DD*RM*PRTPAGQHRRSI 
IMK DCRRGPQPAKTGGAT 
S*RIADVAPNPRRPAAQQ 

ACT AGT AGA ATA GCG TAG ATG CCG GCC CAA CCC CGC GGA ACC ACG GCG GAC GAC 
11565 11574 11583 11592 11601 1161.0 

TGA TCA TCT TAT CGC ATC TAC GGC CGG GTT GGG GCG CCT TGG TGC CGC CTG CTG 

*SSYRI YGRVGAPWCRLL 
DHLIAS TAGLGRLGAACC 
I ILSH LRPGWGALVPPAT 

HAPGASAH ALRILRGTG] 
TLLARRPTPLASLAA RAR 
RSCPGGLRPCPPYPPGHG 

ACT CGT CCC GGG CGG CTC CGC ACC CGT TCC GCC TAT TCC GCC GGG CAC GGG 
11619 11628 11637 11646 11655 11664 

TCG TGA GCA GGG CCC GCC GAG GCG TGG GCA AGG CGG ATA AGG CGG CCC GTG CCC 

S *AGPA EAWA RR I RR P VP 
REQGPPRRGQGG*GGPCP 
VSRARRGVGKADKAARAI 



T H V AIVGSPVRSRTRR AC 

H t C P (l) *aplfaav ,pggpa 

T .HARCDRRFSRP*PDAQR 

CCA CAC ACG TGC CGT TAG TGC GGC CTT CCT TGC GCC GAT GCC CAG GCG GAC CGC 
11673 11682 11691 11700 11709 11718 

GGT GTG TGC ACG GCA ATC ACG CCG GAA GGA ACG CGG CTA CGG GTC CGC CTG GCG 



/GVCTAI TPEGTRLRVR LA 



JST' V C AR Q S RR KERG Y G S A W R 
C V H G N H A G R N A A T G PPG i 

GR GP A P SAGRL I R C G P P I 
VAGLRRHHVEFFGADRRG 
WRAWAGTICRSSDPMGAA 

GGT GGC GCG GGT CCG CGG CCA CTA CGT GGA GCT TCT TAG GCC GTA GGG CCG CCG 
11727 11736 11745 11754 11763 11772 

CCA CCG CGC CCA GGC GCC GGT GAT GCA CCT CGA AGA ATC CGG CAT CCC GGC GGC 




P R< G • • Q* F- ' P - A -R ★ - R — S'^ ' Q - D * A - P A R 

GCC GGA CGG GAG TTT GCC COG CGC AGT GGA CGA AAC GAG CCG GCC GGT ACG CGC 
11781 11790 11799 11808. 11817 11826 

CGG COT GCC CTG AAA CGG GGC GCG TCA CCT GCT TTG GTC GGC CGG CCA TGC GCG 

RPALKRG ASPALVGRPCA 
GLP* NGARHLLWSAGHAR 
ACPETGRVTCFGRPAMRA 

RL*RITAPyiFVRKSLSE 
GYD VSRQP IYSFGNRYVK 
G T I L P D N R S. I H F G T E I F K 

GGG GCA TTA GTT GCC TAG CAA CGC CCT ATA TAG TTT TGG GCA AAG CTA TTT GAA 
11835 11844 11853 11862 11871 11880 

CCC CGT AAT CAA CGG ATC GTT GCG GGA TAT ATG AAA ACC CGT TTC GAT AAA CTT 

PRNQRIVAGY MKTRFDKL. 
PVINGSLRDI*KPVS INF 
P*STDRCGIYENPFR*TF 

C Q R CAR K TWSP S S P AR * R 
NAVHAN QGARRRLRGSG 
R MPSMRTKDLEAVFAGAV 

AGC GTA ACC GCT GTA CGC GCA AAA CAG GTC GAG CCG CTG CTT CCG CGG GCG ATG 
11889 11898 11907 11916 11925 11934 

TCG CAT TGG CGA CAT GCG CGT TTT GTC CAG CTC GGC GAC GAA GGC GCC CGC TAC 

SHWRHARFVQLG DEGARY 
R I G D M R V L S S S A T.K A P A T 
A LA T CA F C PARR RR R P L P 

GHCHSLQRTGASGQPAVG 
GTVTA*NVREQLVRPPWV 
ARSLPEI SANRCFGPP GC 

. GCG GGC ACT GTC ACC GAG TTA ACT GCG CAA GGA CGT CTT GGG ACC CCC CGG TGT 
^ 11943 11952 11961 11970 11979 11988 

^GC CCG TGA CAG TGG CTC AAT TGA CGC GTT CCT GCA GAA CCC TGG GGG GCC ACA 

R P * Q W L N * R V P A E P W G A T 
ARDSGS IDAFLQNPGGP. H 
PVTVAQLTRSCRTLGG.HT 

RIEPNGARLGQRRPRHPQ 
ESRLIGLAYAKAVLATRN 
RPD* SEWRTPRPSSPPAT 

GGA GCC TAG AGT CCT AAG GGT CGC GCA TCC GGA ACC GCT GCT CCC GCC ACG CCA 
11997 12006 12015 12024 12033 12042 

CCT CGG ATC TCA GGA TTC CCA GCG CGT AGG CCT TGG CGA CGA GGG CGG TGC GGT 

PRISGFPARRPWRRGRCG 
LGSQDSQRVGLGDEGGAV 
S DLR I P S A *AL AT R A VR L 

-47- 



AGPLAGDDQQRPVRGGPP 
PVRF REMMKSVHYEVGQR 
PCGSASW*RASTTSSGRA 



ACC CGT GGG CCT TCG CGA GGT AGT AGA ACG ACT GCA CCA TGA GCT GGG GGA CCG 
12051 12060 12069 12078 12087 12096 

TGG GCA CCC GGA AGC GCT CCA TCA TCT TGC TGA CGT GGT ACT CGA CCC CCT GGC 

WAPGSAPSS C*RGTRPPG 
GHPEALHHLADVVLDPLA 
GTRKRS I I LLTW .YS T PWR 

QPLAQQRHLHHA*RRRHT 
SLYLKSAICTTREGAAIR 
AS T S S A P S APPA S VQP S A 

CCG ACT CCA TCT CGA ACG ACC GCT ACG TCC ACC ACG CGA GTG GAC GCC GCT ACG 
12105 12114 12123 12132 12141 12150 

GGC TGA GGT AGA GCT TGC TGG CGA TGC AGG TGG TGC GCT CAC CTG CGG CGA TGC 




CAA GCT Act AGA ACC GCA GGT CCG ACC TAT TCC AGC ACC CCC GCC AAG AGT GGA 
12159 12168 12177 12186 *12195 12204 

GTT CGA TGA TCT TGG CGT CCA GGC TGG ATA AGG TCG TGG GGG CGG TTC TCA CCT 

VR*S WRPGWIRSWGRF SP 
FDDL GVQAG* G RGGGSHL 
SM I LASRLD KVVGAVLTW 

VGQPFLASLHRSRRPPVL 
Y ERPSSHQSTDLAGPRSW 
,^T SGP PLTSLP T SLAPAPG 

'~ 

CCA TGA GGG ACC CCC TTC TCA CGA CTC TCC ACA GCT CTC GCG GCC CCG CCC TGG 
12213 12222 12231 12240 12249 12258 

GGT ACT CCC TGG GGG AAG AGT GCT GAG AGG TGT CGA GAG CGC CGG GGC GGG ACC 

GTP WGKSAERCR ERRGGT 
VLPGGRVLRGVESAGAGP 
YSLGEEC*EVS RAPGR DQ 

CRR SVGKYGVS T*WCYHV 
AGAASEKTGLVREGATTS 
PVPPQSRQVWC ENVLLLP 



TCC GTG GCC GCC GAC TGA GGA AAC ATG 
12267 12276 12285 

AGG CAC CGG CGG CTG ACT CCT TTG TAC 



GGT TGT GAG CAA GTG GTC GTC ATC ACC 
12294 12303 12312 

CCA ACA CTC GTT CAC CAG CAG TAG TGG 
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GTGG*LLCTQHSFTS SSG 
APAADSFVPNTRSPAVVD 

KT*TGTATRPCQTTRAFP 
KRE P A P RP EQVN P Q E L L H 
SENLHRDRNKSMPNNSCI 

TGA AAG CAA GTC CAC GGC GAG CGC CAA GAA CCT GTA AGO CAA CAA GCT CGT TTA 
12321 12330 12339 12348 12357 12366 

ACT TTC GTT GAG GTG GCG GTC GCG GTT CTT GGA CAT TGG GTT GTT CGA GCA AAT 

TFVQV PVAVLGHWVVRAN 
LSFRCRSRFLDIGLFEQM 
FRSGAGRGSWTLGCS SKW 

A P K P P R RGASRVE RDHRD 
PPNRPGAAPQGSKVIMAT 
PRTE PAQPRSVP S * S * PP 

CGC CGC CCA AAG CCC GCG GAG GCG GGC CGA GTG GCG TGA AGT GCT AGT ACC GCG 
12375 12384 12393 12402 1241 1 12420 

GGG GCG GGT TTC GGG GGC GTG CGG GCG GCT GAC CGG ACT TGA CGA TGA TGG CGG 

/ GAGFGGLRPADRTSRSWR 
GRVSGACGRLTGLHDHGG 
GGFRGPAAG*P DFTI MAV 

ALPQSPETTSASRPTVAA 
RLLSRRS PLQPAGPHLPR 
GCSAAVARYNLREPTYR G 

AGG CGT TCT CGG ACG CTG CGG AGC CAT CAA GTC CGC GAG GGC CCA CAT TGC CGG 
12429 12438 12447 12456 12465 12474 

TGC GCA AGA GGC TGC GAC GGC TGG GTA GTT GAG GCG CTC CGG GGT GTA ACG GCG 

SARGCDGSVVEALRGVTA 
PQEAATAR*LRRSGV*RP 
RKRLRRLGS*GAPGCNGR 



DRATAHGNRGR 



F R P Y C A D 



. M G R Q P - T G T G A A F G R . T - V - P (^M^ ^ - 
CGASH RAREPRSVAPLLC 

CGT AGG GCG CGA CAC CGC ACG GGC AAG GCG GGC GCT TTG GCG CCC ATT GTC CGT 
12483 12492 12501 12510 12519 12528 

GCA TGC CGC GCT GTG GCG TGC GCG TTC CGG CGG CGA AAC CGC GGG TAA CAG GCA 

ASRAVAC PFRPRNRG* QA 
HPALWRARSGRE TAGNRH 
IPRCGVPVPAA KPRVTGI 

PRGSFERSTVRH QRRVPG 
QGAPFSAPR*ATNDASPV 
RAPRFVRPVDRPTTPPRS 



AGA GCG GCG GGC CTT TTG AGC GCG CTG CAG TGC GCG ACA ACA GCG GGC TGC CCT 
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rZS JT^ r25T6' 12555 '^ ITSW ' 12573-" * " 12582 

TCT GGC CGG CCG GAA AAC TCG CGG GAC GTC ACG CGG TGT TOT CGG CGG ACG GGA 



SGRPENSRDVTRCCRRTG 
LAGRKTRGTSRGVVGGRD 
WPAGKLAGRHAVLSADGT 

SDHAGGVPSSIEKCTG TK 
RIMPAASLVLFKRVRARR 
GF*PRRRCS*FN G*VHGD 

GGG CTT AGT ACC CGC GGC GGC TGT CCT GAT CTT TAA AGG AAT GTG CAC GGG CAG 
12591 12600 12609 12618 12627 12636 

CCC GAA TCA TGG GCG CCG CCG ACA GGA CTA GAA ATT TCC TTA CAC GTG CCC GTC 

PESW APPTGLEI SLHVPV 
PNHGRRRQD*KFPYTCPS 
RIMGAADRTR NFLTRARL 

DEVGAFRHRPVLPSPMF I 
I RSAQSDTAHFSHLRCSF 
*GRRRRIQPTSRT SV AHF 

^Itjl^h^ AGG AGC TGC GGA CGC TTA GAC ACC GCA CCT TGC TCA CCT CTG CCG TAC TTT 
12645 12654 12663 12672 12681 12690 

TTA TCC TCG ACG CCT GCG AAT CTG TGG CGT GGA ACG AGT GGA GAC GGC ATG AAA 

L S STPANLWRGT S GD G (u) K j/\ 

YP RRLRICGVER VETA*K 
ILD .ACESVAWNEWRRHEN 



STSCGV QLRSVTRSPRPP 
RHAAAS RYGPYPAPRARR 
DIHQLRGTVQIRHPVPA A 

TAG CTA CAC GAC GTC GGC TGG ACA TTG GAC CTA TGC CAC GCC CTG CCC GCG CCG 
12699 12708 12717 12726 12735 12744 

ATC GAT GTG CTG CAG CCG ACC TGT AAC CTG GAT ACG GTG CGG GAC GGG CGC GGC 

^Tlt>VLQPTCNLDTVRDGRG 
SMCCSRPVTWIRCGTGAA 
R C A A A D L * -P G- Y G A ,G R A R R 

IK VQ TGGSGMRSNLI SC R 
F K * R P G G P A W 6 P I * Y A A G 
SNEGPDGRLGDQFEIHQV 

CCT TAA AAG TGG ACC CAG GGG GGC CTC GGG TAG GAC CTT AAG TTA TAC GAC GTG 
12753 12762 12771 12780 12789 12798 

GGA ATT TTC ACC TGG GTC CCC CCG GAG CCC ATC CTG GAA TTC AAT ATG CTG CAC 

GIFTWVPPEPILEFNMLH 
EFSPGSPRSPSWNSICCT 
NFHLGPPGAHPGIQYAAP 

YGPFTRPRC**GCKTSYR 
TGPFPARGANDGASQRTG 
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Q V IC L fer A r" V — K 'D' L V 

GAC ATG GGC CCT TTC CAC GCG CCG GAG GTA ATA GTG GGC GTG AAA GAG CTC ATG 
12807 12816 12825 12834 12843 12852 

CTG TAG CCG GGA AAG GTG CGC GGC CTG CAT TAT CAC CCG CAC TTT GTC GAG TAC 

LYPGKVRGLHYHPHFV EY 
CTRERCAACIITRTLSST 
VPGKGAR PALSPALCRVP 

SNTSPEPTSIVLSSASSG 
ATRRPS PRAS *WPRRRLG 
Q QEDLARAHQDGLVVGFV 

GAC GAC AAG CAG CTC CCG AGC CCG CAC GAC TAG TGG TTC CTG CTG CGG CTT CTG 
12861 12870 12879 12888 12897 12906 

CTG CTG TTC GTC GAG GGC TCG GGC GTG CTG ATC ACC AAG GAC GAC GCC GAA GAC 

LLFVEGSGVLITKDDAED 
CCSSRARAC*SPRTTPKT 
AVRRGL GRADHQGRRR RP 

LQL SSNMWTERPTQVLVG 
WSCLPI *GRRARPRCWSA 
'*GVAFL FEDVDRAPDAGPR 

GGG TTG ACG TTT CTC CTT AAG TAG GTG CAG AGC GCG CCC CAG ACG TGG TCC TGC 
12915 12924 12933 12942 12951 12960 

CCC AAC TGC AAA GAG GAA TTC ATC CAC GTC TCG CGC GGG GTC TGC ACC AGG ACG 

PNCKEEFIHVSRGVCTRT 
P .TA K R N S S T S R A G S A P G R 
QLQRGI HPR L A RGLHQDA 

APTMCE TW AMEDRVNMAM 
PRP*ASRGRWRTGST*R W 
RGPD HVGDVGDR GQREDG 



GGC CGG CCC CAG TAC GTG AGG CAG GTG CGG TAG AGC AGG GAC TGC AAG TAG CGG 
12969 12978 12987 12996 13005 13014 

^^JCG GCC GGG GTC ATG CAC TCC GTC CAC GCC ATC TCG TCC CTG ACG TTC ATC GCC 

PAGVMHSVHAISSLTFIA 
RPGSCTPS -TPSRP *RS SP 
GRGHALRP .RHLVPDVHRH 

SVLGQSSHSGGST*TSG S 
A*WARPRIRDAAPEPRAA 
HEGLGPVFAI RRQNLDLR 

TAC GAG TGG TTC GGG ACC CTG CTT ACG CTA GGC GGC GAC CAA GTC CAG CTC GGC 
13023 13032 13041 13050 13059 13068 

atg ctc acc aag ccc tgg gac gaa tgc gat ccg ccg ctg gtt cag gtc gag ccg 

mltkpwdecdpplvq'vep 
cspspgtnairrwfrssr 
ahqalgrmrsaagsgraa 
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GCVSSRGHPDGHDAGPPE 
AACA .PAGTLTATTPAPPN 
QRVRQLARSPRRPRRRPT 

GAG GGC GTG TGC GAG CTC GCG GGC ACT CCC AGC GGC ACC AGO CGC GGC CCC CCA 
13077 13086 13095 13104 13113 13122 

CTG CCG CAC ACG CTG GAG CGC CCG TGA GGG TCG CCG TGG TCG GCG CCG GGG GGT 

LPHTLERP*GSPWSAPGG 
C R T R W S A R EGRRGRRRGV 
AAHA GA P^R VAV V G A G G FV^^> 

r- 

DARGDGPCQTGRGNGHRT 
T PVATVRASPEAAMGTVR 
R RCPR*GPVPNRPWERSA 

AGC AGC CGT GCC GGC AGT GGG CCC GTG ACC CAA GGC GCC GGT AAG GGC ACT GCG 
13131 13140 13149 13158 13167 13176 

TCG TCG GCA CGG CCG TCA CCC GGG CAC TGG GTT CCG CGG CCA TTC CCG TGA CGC 

f , S SARP S P GHWVPR P F P * R 
R RH GR H P G T GFR G H S R D A 
Jjtti; VGTAVTRALGSAA IPVTR 

GVVLLCATAAGEVHQDVR 
AL* S SARRLPGKS T S T LA 
HWSRPPVGYRGRRRAP *R 



CAC GGT TGA TGC TCC TCC GTG CGG CAT CGC CGG GGA AGC TGC ACG ACC AGT TGC 
13185 13194 13203 13212 13221 ' 13230 

GTG CCA ACT ACG AGG AGG CAC GCC GTA GCG GCC CCT TCG ACG TGC TGG TCA ACG 

VPTTRRHAVAAPS T C W S T 
CQLRGGTP*RPLRRAGQR 
ANYEEARRSGPFDV LV NA 

GAGGPTVPGPLVGVVVAA 
AQGERR*QARCCGSSSRR 
PRGRGANSPGAAGRRRGG 



4 jT^* 

bcC GGA CGG - GGA GGG CCG CAA TGA. CCC GGG CCG TCG TGG GGC TGC TGC TGG CGG 
13239 13248 13257 13266 13275 13284 

CGG CCT GCC CCT CCC GGC GTT ACT GGG CCC GGC AGC ACC CCG ACG ACG ACC GCC 




CGC TCT GCC AGC TGT TCT GGG CCC GCG AGG AAG CGC TGA CCC TCA CCG TGG CGA 
13293 13302 13311 13320 13329 13338 

GCG AGA CGG TCG ACA AGA CCC GGG CGC TCC TTC GCG ACT GGG AGT GGG ACC GCT 
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RDGRQDPGAPSRLGVGPL 
ETVDKTRALLRDWEWDRF 

DLDAGD GRAGLQVGGVAP 
TWILVMEARVWSSVG*PR 
RGS*CWRRACGAPCGRRG 

AGC AGG TCT AGT CGT GGT AGA GGC GCG CGT GGG TCG ACC TGT GGG GGA TGC CGG 
13347 13356 13365 13374 13383 13392 

TCG TOO AGA TCA GCA CCA TCT CCG CGC GCA CCC AGC TGG ACA CCC CCT ACG GCC 

SSRSAPSPRAPSWTPPTA 
RPDQHHLRAHPAGHPLRP 
VQISTI SARTQLDTPYGR 

VPGLGL LEARAMQDDAQA 
FRASAS SSQAPWRTTRRP 
SGPRPRPARRPGDPRGGP 

CCT TGG CCC GGC TCC GGC TCG TCG AGA CGC GCC CGG TAG ACC AGC AGG CGG ACC 
13401 13410 13419 13428 . 13437 13446 

.^GGA ACC GGG CCG AGG CCG AGG AGC TCT GCG CGG GCC ATC TGG TCG TCC GCC TGG 

mx 

, " — — 

GTGPRPR S SARA I W S S AW 
E P GR GR GALRGP S GRP P G 
N RAEAE ELCAGHLVVRLG 

GHVAVAVGLANEDVDEFL 
GMYPSLLVLPTRMSMRS S 
GWTRRCCCWPRE*RCGRL 

CGG GGT ACA TGC. CGC TGT CGT TGT GGT TCC CGC AAG AGT AGC TGT AGG AGC TTC 
13455 13464 13473 13482 13491 13500 

GCC CCA TGT ACG GCG ACA GCA ACA CCA AGG GCG TTC TCA TCG ACA TCC TCG AAG 

APCTAT A T .PRAF S S T S S K 
PHV RRQQHQGRSHRHPRR 
PMYGDS NTKGVL I D I L E E 

LGDV RVALRA LAE RRDLP 
C G T * A C P S D R W L K A G : T S H 
AARRRARRTAGS SR APRT 

TCG TCG GGC AGA TGC GCG TGC CGC TCA GCG CGG TCT CGA AGC GCG GCC AGC TCA 
13509 13518 13527 13536 13545 13554 

AGC AGC CCG TCT ACG CGC ACG GCG AGT CGC GCC AGA GCT TCG CGC CGG TCG AGT 

SSPSTRTA SRARAS RRS S 
AARLRARRVAPE LRAGRV 
QPVY AHGESRQSFAPVE W 

AAAPHG GVEVGL PQPL H P 
HPPQTAEWRSASPSHSTP 
TRRSPPRGGRRRPATPPP 



CCA CGC CGC CGA CCC ACC GGA GGG TGG AGC TGC GGC TCC CCG ACA CCC TCC ACC 
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13563^ 1357^^^-- 13S8T ' T3590T'- -|3S9^9 ' 13608 

GGT GCG GCG GCT GGG TGG CCT CCC ACC TCG ACG CCG AGG GGC TGT GGG AGG TGG 

GAAAGWPPTSTPRGCGRW 
VRRLGGLPP RRRGAVGGG 
CGGWVASHLDAEGLWEVG 

RPRRDAQPLDPVRDTRTG 
ARVVTLRRSILSATPERE 
PA SSP*GAPS*PRPRNAN 

CCC GCG CCT GCT GCC AGT CGG ACG CCC TCT AGT CCC TGC GCC AGC CAA GCG CAA 
13617 13626 13635 13644 13653 13662 

GGG CGC GGA CGA CGG TCA GCC TGC GGG AGA TCA GGG ACG CGG TCG GTT CGC GTT 

GRGRRSACGRSGTRSV -RV 
GADDGQPAGDQGRGRFAF 
ARTTVSLREIRDAVGSRS 

DEGAGALVVLEGQDAFGV 
TKAPARLSSWNGRTLSGS 
RRRRRGCPRG .TGGP*RVR 

^pfeOC AGA AGC GGC CGC GGG CGT TCC TGC TGG TCA AGG GGG ACC AGT CGC TTG GGC 
13671 13680 13689 13698 13707 13716 

CCG TCT TCG CCG GCG CCC GCA AGG ACG ACC AGT TCC CCC TGG TCA GCG AAC CCG 

PSSPAPARTTSSPWSA NP 
RLRRRPQG RPVPPGQRT R 
VFAGARKDDQFPLVSEPD 

PRVGCI DDAPEPGTASCQ 
QGSAASTMPQSLARLRAS 
SAPRRLH *RSA*PGYGLV 

TGA CCG GCC TGC GGC GTC TAC AGT AGC CGA CCG AGT CCC GGG CAT CGG CTC GTG 
13725 13734 13743 13752 13761 13770 

ACT GGC CGG ACG CCG CAG ATG TCA TCG GCT GGC TCA GGG CCC GTA GCC GAG CAC 

^ ,T G R T P Q M S S A G S G P V A E H 

LAGRRRCHRLAQGP* PST 
' '"^ W P D A A D V I G W L R A R S R . A L 

SSF*SCSRDSSR*RGNGS 
VPSDHAR GTVRGDDVTAP 
SQLIMLVVP*EVTMSRQR 

ACT GAC CTC TTA GTA CTC GTG CTG GCC AGT GAG CTG GCA GTA GCT GGC AAC GGC 
13779 13788 13797 13806 13815 13824 

TGA CTG GAG AAT CAT GAG CAC GAC CGG TCA CTC GAC CGT CAT CGA CCG TTG CCG 



* L E N H EHDRSLDRHRPLP 
D W R I ^) STTGHSTVIDRCR 
TGES*AJIPVTRPSSTVAG 



-3 



RR CCRT AARARGRVAPG * 
DAVVGLQQGHEVESRLGE 
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CTA GAC GCT GTT GTG GCT CAA CGA CGG GCA CGA GCT GGA GCC TGG CGT CCG GGA 
13833 13842 13851 13860 13869 13878 

GAT CTG CGA CAA CAC CGA GTT GCT GCC CGT GCT CGA CCT CGG ACC GCA GGC CCT 



DLRQHRVAARARPRTAGP 
I CDN TELLPVL DLGPQAL 
SATTPSCCPCSTSDRR PS 

RRTGASGRRPRATREAPA 
G -A HER P GAALVHRVNR Q L 
VPTNGRVRPS STGYTGSS 

GTG GCC GCA CAA GGG CGC CTG GGC GCC GCT CCT GCA CGG CAT GCA AGO CGA CCT 
13887 13896 13905 13914 13923 13932 

CAC CGG CGT GTT CCC GCG GAC CCG CGG CGA GGA CGT GCC GTA CGT TCC GCT GGA 

HRRVPADPRRGRAVRS A G 
TGVFPRTRGEDVPYVPLE 
PACSRGPAARTCRTFR .WS 

. P ASSARRNR.VPAAAGCRR 
J0^s Q HAARGATAFQHLQAVGG 
^^ S T R Q E G P P Q S S T C S R W V A 

CGA CCA CGC GAC GAG CGG GCC GCC AAC GCT TGA CCA CGT CGA CGC GGT GTG GCG 
13941 13950 13959 13968 13977 13986 

GCT GGT GCG CTG CTC GCC CGG CGG TTG CGA ACT GGT GCA GCT GCG CCA CAC CGC 

AGALLAR RLRTGAAAPHR 
LVRCSPGGCELVQLRHTA 
WCAARPAVANWCS CATPP 

SRG*TRRPSRSGTWG*GS 
V ,E A E H V A L A V A V P G A E V A 
SKPRMYP SP*P*R DLRLR 

GCT GAA GCC GGA GTA CAT GCC GCT CCC GAT GCC GAT GGC CAG GTC GGA GTT GGC 
^. , 13995 14004 14013 14022 14031 14040 

di^GA CTT CGG CCT CAT GTA CGG CGA GGG CTA CGG CTA CCG GTC CAG CCT CAA CCG 

/. , 

RLRPHVRRGLRL PVQ PQ P 
DFG LMYGEGYGYRSSLNR 
TSASCTARATATGPASTA 

WPPG GAR CPRRW*RGPRG 
GHRVVQAALDGGDGAQDV 
EMASWRRPLTAAMVPRTS 

GAG GTA CCG CCT GGT GGA CGC GCC GTT CCA GCG GCG GTA GTG GCC GGA CCA GCT 
14049 14058 14067 14076 14085 14094 

CTC CAT GGC GGA CCA CCT GCG CGG CAA GGT CGC CGC CAT CAC CGG CCT GGT CGA 

LHGGPPARQGRRHHRPGR 
SMADHLRGKVAAITGLVD 
PWRTTCAARSPPSPAWST 
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R GRRGPRPCRCCRRCGAP 
EAGAVQDHVDAAVVAGQQ 
RPGPSRTTS MPLLSPVRS 



GGA GCC GGG GCC GCT GGA CCA GCA CCT GTA GCC GTC GTT GCT GCC GTG GGA CGA 
14103 14112 14121 14130 14139 14148 

CCT CGG CCC CGG CGA CCT GOT CGT GGA CAT CGG CAG CAA CGA CGG CAC CCT GCT 

PRPRRPGRGHRQQRRHPA 
LGPGDL V VDIGSNDGTLL 
SA PATWSWTSAAT TAPCW 

PRGRRRAGGPRLPGRRWR 
RGVGGVPGAQDSHVGGGG 
AA*GASPGRRTPTSGAAV 

CCG CCG GAT GGG GCG GCT GCC CGG GGC GGA CCA GCC TCA CCT GGG GCG GCG GTG 
14157 14166 14175 14184 14193 14202 

GGC GGC CTA CCC CGC CGA CGG GCC CCG CCT GGT CGG AGT GGA CCC CGC CGC CAC 

GGLPRRRAPPGRSGPRRH 
AAYPADGPRLVGVDPAAT 
Wf^ RPTPPTGPAWSEWTPPPP 

RRRTRGAPRRASGRSRRM 
DEGRGVRRADLQDGVEEC 
TKAAD*GGPTSS IGSKKA 

GCA GAA GCG GCG CAG GAT GGG CGG CCC GCA GCT CGA CTA GGG GCT GAA GAA GCG 
14211 14220 14229 14238 14247 14256 

CGT CTT CGC CGC GTC CTA CCC GCC GGG CGT CGA GCT GAT CCC CGA CTT CTT CGC 

RLRRVLPAGRRADP RLLR 
VFAASYPPGVELIP DFFA 
SSPRPT RRASS*SPTSSH 

RGAR RAGRWPR*RSRSTR 
VVQEA PAAGLDDGRDRHE 
.^Y S R S P P R RA L T T V E I A I N 
»^ _ _ 

TAT GCT GGA CGA GCC GCC CGC GGC GCG GTT CCA GCA GTG GAG CTA GCG CTA CAA 
14265 14274 14283 14292 14301 14310 

ATA CGA CCT GCT CGG CGG GCG CCG CGC CAA GGT CGT CAC CTC GAT CGC GAT GTT 

IRPARRAPRQGRHLDRDV 
YDLLGGRRAKVVTSIAMF 
TTCSAGAAPRSSPRSRCS 

RGA ADWPT*AP PRGGASP 
VVQRT GHLEHPLDAAQQR 
*SRGRGMSNMRSTPRRSV 



GAT GCT GGA CGG CGC AGG GTA CCT CAA 
14319 14328 14337 

CTA CGA CCT GCC GCG TCC CAT GGA GTT 



GTA CGC CCT CCA GCC GGC GGA CGA CTG 
14346 14355 14364 

CAT GCG GGA GGT CGG CCG CCT GCT GAC 



-56- 



YDLPRPMEFMREVQRLLT 
TTCRVPWSSCGRSAAC*R 



RRCRP S R -A S SOAR S A GR R 
VVADPHGLLAIQGRHEVG 
SSPMQTVSCL*RGAI SWA 

CCT GCT GCC GTA GAG CCA CTG GCT CGT CTC GAT AGA CGG GCG CTA CGA GGT GCG 
14373 14382 14391. 14400 14409 14418 

GGA CGA CGG CAT CTG GGT GAC CGA GCA GAG CTA TCT GCC CGC GAT GCT CCA CGC 

GRRHLGDRAELSARDAPR 
DDGIWVTEQSYLPAMLHA 
TTASG*PSRAICPRCSTP 

RRRRPRGRAGPSSR AAGS 
A GVVHDAVLVQVVVP QAL 
QA*STTQWSCRS**PSRW 

GAC GCG GAT GCT GCA CCA GAC GGT GCT CGT GGA CCT GAT GAT GCC CGA CGC GGT 
14427 14436 14445 14454 14463 14472 

j^TG CGC CTA CGA CGT GGT CTG CCA CGA GCA CCT GGA CTA CTA CGG GCT GCG CCA 

LRLRRGLPRAPGLLRAAP 
CAYDVVCHEHLDYYGLRQ 
A PTTWSATST.WTTTGCAR 

RTSPRACRGSPPPHR ASG 
DLPHGLAGAQLHHIGLQ G 
ISHIASRVPRFTTSASS V 

CTA GCT GAC CTA CCG GCT CGC GTG GCC GGA CTT CCA CCA CCT ACG GCT CGA CTG 
14481 14490 14499 14508 14517 14526 

GAT CGA GTG GAT GGC CGA GCG CAC CGG CCT GAA GGT GGT GGA TGC CGA GCT GAC 

DRVDGRAHRPEGGGCRAD 
lEWMAERTG LKVVDAELT 
S SGWP SAPA*RWWMP S * P 

p R R R R F.G R A R A P -G G R S R E G 
' G D V A S A E R E H Q- G A A A G R A 
GT*PPLRESTSARRPEER 

GGG GCA GAT GCC GCC TTC GGA GAG CGA GCA CGA CCG GGC GGC GCC GAG GAG AGC 
14535 14544 14553 14562 14571 14580 

CCC CGT CTA CGG CGG AAG CCT CTC GCT CGT GCT GGC CCG CCG CGG CTC CTC TCG 

PRLRRKPLARAGPPRLLS 
PVYGGSLSLVLA R RGSSR 
PSTAEASRSCWPAAAPLA 

P *RAP AP GCGRRL S P GAR 
LDVLRRQ G ADAGS L R VQG 
WTLSGA SARMRAPSV SRG 



GGT CCA GTT GCT CGG CCG CGA CCG GGC GTA GGC GCG GCC . TCT CTG CCT GGA CGG 
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14589 1^598^ > r^GOl- - 1^616^^^ -T^25-" — ^4634 

CCA GGT CAA CGA GCC GGC GCT GGC CCG CAT CCG CGC CGG AGA GAC GGA CCT GCC 



PGQRAGAGPHPRRRDGPA 
Q VNEPALARIRAGETDLP 
RSTSRRWPASAPERRTCP 

RPTRGASRPTGHGVGPI G 
VRLEGPPGLLGTVSEQFE 
*ASNARRVSSDRSRSRSN 

GAT GCG CCT CAA GCG GGC CGC CTG GCT CCT CAG GGC ACT GGC TGA GGA CCT TAA 
14643 14652 14661 14670 14679 . 14688 

CTA CGC GGA GTT CGC CCG GCG GAC CGA GGA GTC CCG TGA CCG ACT CCT GGA ATT 

LRGVRPADRGVP*PTPGI 
YAEFARRTEESRDRLLEF 
TRSSPGGPRSPVTDSWNS 

*RRAPCPAACGQSRRRS S 
EGGRPVLPQVGKAVAG RR 
R V A E R S L P S C V R P * P A E V 

^^IGA GTG GCG GAG CGC CCT GTT CCC CGA CGT GTG GGA ACC GAT GCC GCG GAG CTG 
14697 14706 14715 14724 14733 14742 

CCT CAC CGC CTC GCG GGA CAA GGG GCT GCA CAC CCT TGG CTA CGG CGC CTC GAC 

P HRLAGQGAAHPWLR RLD 
LTASRDKGLH TLGYGAS T 
SPPRGTRGCT. PLATA PRR 

PCR*GATSRGPRSAGARC 
LAVDDQLVAAQVLREQGA 
FPLT M RCYQPRSSVSRGQ 

CTT CCC GTT GCA GTA GGA CGT CAT GAC GCC GGA CCT GCT CTG CGA GGA CGG GAC 
14751 14760 14769 14778 14787 14796 

GAA GGG CAA CGT CAT CCT GCA GTA CTG CGG CCT GGA CGA GAC GCT CCT GCC CTG 



.EGQRH PAVLRPGRDAPAL 



aP'^K GNVILQYCGLDETLLPC 
R A T S S C S T -A A W T R R S C P A 

RRPSRPCT RSSCARC SCG 
DGLHVLVLEAAVRG 'ARVD 
MASTFSSL NPQ*VG PVFM 

GTA GCG GCT CCA CTT GCT CCT GTT CAA GCC GAC GAT GTG CGG GCC GTG CTT GTA 
14805 14814 14823 14832 14841 14850 

CAT CGC CGA GGT GAA CGA GGA CAA GTT CGG CTG CTA CAC GCC CGG CAC GAA CAT 

HRRGE RGQVRLLHARHEH 
lAEVNEDKFGCYTPGTNI 
SPR*TRTSSAATRPARTS 

SRRRPPPGPAQARGTGPG 
RDDGLL LGPRKLGVLEQD 
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GGG CTA CCA GAG GOT COT CCT CCG GGC CCG CGA ACT CGG GCT GGT CAA GGA CCA 
14859 14868 14877 14886 14895 14904 

CCC GAT CGT CTC CGA GGA GGA GGC CCG GGC GCT TGA GCC CGA CCA GTT CCT GGT 

PDRLRGGGPGA*ARPV PG 
PIVSEEEARALEPDQFLV 
RSSPRRRPGRLSPTSSWS 

GTSRGPR SPRGPVRSGPR 
ERPDVPVRHDGPFAVEQG 
RGHI *RSAITARSRSKRA 

GGA GGG CAC CTA GAT GGC CCT GCG CTA CCA GCG GGC CCT TGC GCT GAA GGA CCG 
14913 14922 14931 14940 14949 14958 

CCT CCC GTG GAT CTA CCG GGA GGC GAT GGT CGC CCG GGA ACG CGA CTT CCT GGC 

PPVDLPGRDG RPGTRLPG 
LPWIYRDAMVARERDFL A 
SRGSTGTRWSPGNATS WP 

RLCGPREAAWAPLQTIPH 
GSAAQDKRQG RQFNHSRT 
' E P P L R T K G S G V S S T T H D P 

GAG GCC TCC GTC GGA CCA GAA AGG CGA CGG GTG CGA CCT TCA ACA CAC TAG CCC 
14967 14976 14985 14994 . 15003 15012 

CTC CGG AGG CAG CCT GGT CTT TCC GCT GCC CAC GCT GGA AGT TGT GTG ATC GGG 

LRRQP GL SAA HAGSCVI G 
SG GSLVFPLPTLEVV* S G_ 
PEAAWS FRCPRWKLCDR 



RLHCRAAGGAHKGHAQQR 
A S T V D R P V V R T S A T H R S D 
P P P S M A R C W G R A Q R T G A T 

ACC GCC TCC ACT GTA GCG CGC CGT GGT GGG CGC ACG AAC GGC ACA CGG ACG ACA 
^ 15021 15030 15039 15048 15057 15066 

^PI?3G CGG AGG TGA CAT CGC GCG GCA CCA CCC GCG TGC TTG CCG TGT GCC TGC TGT 

WRR * HRA APPAC L P C A C C 
GGG DIARH HPRACRVPAV 
AEV TSRGTTRVLAVCLL S 

H QRQQGRGQQQPVAGRAL 
TSGSSAAARSSHCPVVPL 
PAAAAPRPGAATARCWPC 

GCC ACG ACG GCG ACG ACC GGC GCC GGG ACG ACG ACA CCG TGC CGT GGT GCC CGT 
15075 15084 15093 15102 15111 15120 

CGG TGC TGC CGC TGC TGG CCG CGG CCC TGC TGC TGT GGC ACG GCA CCA CGG GCA 

RCCRCWPRPCCCGTAPRA 
GAAAAGRGPAAVARHHGQ 
VLPLLAAALLLWHGTTGK 
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VVRRSGAGPTGRRPIRRM 
SSADRGPEPLAVGPSAGC 
PRRTAVRSRSHWAPPHAA 



TCC TGC TGC GCA GCG CTG GGC CGA GGC CCT CAC GGT GCG GCC CCC TAG GCG GCG 
15129 15138 15147 15156 15165 15174 

AGG ACG ACG CGT GGC GAG GCG GCT GCG GGA GTG CCA CGC CGG GGG ATG CGC CGC 

RTTRRDPAPGVPRRGMRR 
GRRVATRLRECHAGGCAA 
DDASRPGSGSA TPGDAPH 

DLRPPQQEGEGH HHGDRP 
TSAHRNSSA RATTTATAR 
HRPTATAARGRRPPPRRA 

TAG A6C TCC GCA CGG CCA ACG ACG AGC GGG AGC GGC ACC ACC ACC GGC AGC GCG 
15183 15192 15201 15210 15219 15228 

ATG TCG AGG CGT GGC GGT TGC TGC TCG CCC TCG CCG TGG TGG TGG GCG TCG CGC 

MSRRGGCCSPSPWWWP SR 
CRGVAVAARPRRGGGRRA 
^fk VEAWRLLLALAVV VAVAR 

GASRQDAPVQALWAHHAL 
AQPASTPRCKPWGRTTPS 
PRRLAPRGASPGAVRPPR 

CCC GGA CGC CTC GCG ACC AGC CGG CCG TGA ACC CGG TCG GTG CGC ACC ACC CGC 
15237 15246 15255 15264 15273 15282 

GGG CCT GCG GAG CGC TGG TCG GCC GGC ACT TGG GCC AGC CAC GCG TGG TGG GCG 

GP A E RW S A G TWA S H AW W A 
GLRSAGRPALGPATRGGR 
AC GALV GRHLGQ P RVV G E 

HDGPDN EARRHEAEDSGP 
I lEPIT RPG ETSPRTA GP 
SRRSRERGKP ARGRRER 

if 

TCT ACT AGA GGC CCT AGC AAG AGC CGG GAA GCC ACG AGC CGG AGC AGC GAG GGC 
15291 15300 15309 15318 15327 15336 

AGA TGA TCT CCG GGA TCG TTC TCG GCC CTT CGG TGC TCG GCC TCG TCG CTC CCG 

R*SPGSFSALRCSASSLP 
DDLRDR SRPFGARPRR SR 
MISGIVLGPSVLGLVAPG 

D VV GEE GGGE VGV E I E D G 
T W S ARK GAARWE * R SR T A 
PGRRGRGRRGGSRGRDRR 



CCC AGG TGC TGC GGG AGA AGG GGC GGC 
15345 15354 15363 

GGG TCC ACG ACG CCC TCT TCC CCG CCG 



GGG AGG TGA GGA TGG AGC TAG AGC AGC 
15372 15381 15390 

CCC TCC ACT CCT ACC TCG ATC TCG TCG 
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GPR RPLPRRPPLLPRSRR 
VHDALFPA ALHSYLDLVJ 

LDPQRQEHEQDAHLETVC 
WIPSASNMNRIPMSNPSV 
GSRAPAT*TGSRCPTRHC 

GGG TCT AGC CCG ACC GCG ACA AGT ACA AGG ACT AGC CGT ACC TCA AGC CAC TGT 
15399 15408 15417 15426 15435 15444 

CCC AGA TCG GGC TGG CGC TGT TCA TGT TCC TGA TCG GCA TGG AGT TCG GTG ACA 

PRSGW R CSCS*SAWSSVT 
PDRAGAVHVPDRHGVR*H 
QIGLALFMPL IGMEFGDI 

VMFARAAGPGGH SDDAD i 
WWSPAPRVPAATPIT PTQ 
GGHLRPG CRPRRPFRRRR 

GGG TGG TAG TTC CGC GCC CGG CGT GGC CCC GGC GGC ACC CTT AGC AGC CGC AGA 
15453 15462 15471 15480 15489 15498 

/^'CC ACC ATG AAG GCG CGG GCC GCA CCG GGG CCG CCG TGG GAA TCG TCG GCG TCT 

mM'^ 

PTMKARAAPGPPWE SSAS 
PP *RRGPHRGRRGN RRRL 
H HEGAGRTGAAVGIVGVC 

HREGEATSQSVRQV .GAV C 
TDNARPQARPYASYVP * A 
RTTRGRSHEPIRATCRSR 

CGC ACA GCA AGC GGG AGC CGA CAC GAG ACC CTA TGC GCG ACA TGT GGC CGA TGC 
15507 15516 15525 .15534 15543 , 15552 

GCG TGT CGT TCG CCC TCG GCT GTG CTC TGG GAT ACG CGC TGT ACA CCG GCT ACG 

ACRSPSAVLWDTRCTPAT 
RVV RPR LC SGIRAVHRLR 
VSF ALGCALGYALYT GY/ 



■PT RVADAEQREGEEQADGH/ 
G S P T- P K R G N V R K R P M A M L 
GPRRRSGAT*GRGPCRWS 

GGG GCC TGC CGC AGC CGA AGG ACG GCA AGT GGG AGA AGG ACC CGT AGC GGT ACT 
15561 15570 15579 15588 15597 15606 

CCC CGG ACG GCG TCG GCT TCC TGC CGT TCA CCC TCT TCC TGG GCA TCG CCA TGA 

PRTASAS CRSPSSWASP* 
PGRRRL PAVHPL PGHRHE 
PDGVGFLPFTLFLGIAM S 

HGGEGHQRPQQHFAPHE I 
TVAKGTSARSSI SRPI SW 
RSRRGRAPAAASPVRSAG 



CGC ACT GGC GGA AGG GGC ACG ACC GCG CCG ACG ACT ACC TTG CGC CCT ACG AGG 
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ISeW'^S^ - 1562*^ ' - T5j5J3-' * 1 564^2- ■ - 15651 * 15660 

GCG TGA CCG CCT TCC CCG TGC TGG CGC GGC TGC TGA TGG AAC GCG GGA TGG TCC 



A*PPSPCWRGC*WNAGCS 
RDR LPRAGAAADGTRDAP 
VTAFPVLARLLMERGMLQ 

GPRAGVGDHPGGGGIEGA 
DRAPV*AMTPAAVASRAQ 
TGPPCRRWRPPRWRRDRR 

TCA GGG CCC GCC CGT GGA TGC GGT AGC ACC CCC GGC GGT GGC GGC TAG AGC GGA 
15669 15678 15687 15696 15705 15714 

AGT CCC GGG CGG GCA CCT ACG CCA TCG TGG GGG CCG CCA CCG CCG ATC TCG CCT 

SPGRAP. TPSWGPPPPI SP 
VPGGHLRHRGGRHRR SRL 
SRAGTYAIVGAATADLAC 

PQQERTEDGQQAATRGQA 
QSSSAPRTARNRPPEG RP 
S AAARP D RRGTA R R NA GP 

iljpfcfeGA CCG ACG ACG AGC GCC CAG AGC AGC GGG ACA ACG CGC CGC CAA GCG GGG ACC 
15723 15732 15741 15750 15759 15768 

GCT GGC TGC TGC TCG CGG GTC TCG TCG CCC TGT TGC GCG GCG GTT CGC CCC TGG 

AGCCSRVSSPCCAAVRPW 
LAAARGSRRPVARRFA P G 
WLLLAGLVALLRGGSPLG 

HQAGEREGRDEEADHHHE 
TSRVRASVATK KPTMTTS 
RAACGRA*RPRRRR*PPA 

CGC ACG ACG CGT GGG AGC GCG AGT GGC GCC AGA AGA AGC CGC AGT ACC ACC ACG 
15777 15786 15795 15804 15813 15822 

GCG TGC TGC GCA CCC TCG CGC TCA CCG CGG TCT TCT TCG GCG TCA TGG TGG TGC 



A CCAPSRSPR SSSASWWC 



RAAHPRAHRGLLRRHG GA 
V L -R T L A L T A V F F G , V M V V L 

DAGGQSADQLPRLAPQGV 
TRGAKRRTRSRGSRRSGS 
RGGRRAVRGPAAPAGAAR 

AGC AGG CGG GGC GGA ACG CTG CGC AGG ACC TCG CCG GCC TCG CGG CCG ACG GGC 
15831 15840 15849 15858 15867 1587-6 

TCG TCC GCC CCG CCT TGC GAC GCG TCC TGG AGC GGC CGG AGC GCC GGC TGC CCG 

SSAPPCDASWSGR, SAGCP 
RPPRLATRPGAAGAPAAR 
VRPALRRVLERPERRLPD 

AAHECQDDGADQQGRDGG 
PPTSVSIMGPTRSDATAV 
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TGC CGC CGC ACG AGT GTG ACT AGT AGG GGC CGC AGG ACQ ACA GGC GCC AGC GGT 
15885 15894 15903 15912 15921 15930 

ACG GCG GCG TGC TCA CAC TGA TCA TCC CCG GCG TCC TGC TGT CCG CGG TCG CCA 



TAACSH* SSPASCCPRSP 
RRRAHTDHPRRPAVRGRH 
GGVLTLIIPGVLLSAVAT 

LEYADMEDEAGEQEAGDA 
SSMPMWRMKPAKRNPAMQ 
RA*LCGD*RRRRGTRRWR 

GGC TCG AGT ATC CGT AGG TAG AGT AGA AGC CGC GGA AGG ACA AGC CGC GGT AGA 
15939 15948 15957 15966 15975 15984 

CCG AGC TCA TAG GCA TCC ATC TCA TCT TCG GCG CCT TCC TGT TCG GCG CCA TCT 

PS S *ASISSSAPSCSAPS 
RAHRHPSHLRRLPVRRHL 
ELIGIHLIFGAFLFGAIC 

R L G R R G Q R V G A A F Q L F E D 
Hp GFV AGARASARPLSCS ST 
GSSRAPGPPR GRCVAPVR 

CGG GCT TCT GGC GCG GCC GGG ACC GCC TGC GGG CGC CGT TTG ACG TCC TTG AGC 
15993 16002 16011 16020 16029 16038 

GCC CGA AGA CCG CGC CGG CCC TGG .CGG ACG CCC GCG GCA AAC TGC AGG AAC TCG 

ARRPRRPWRTPAANCRNS 
PEDRAGPGGRPRQTAGTR 
PKTAPALADARGKLQELV 

GGYQQRRE EGRDAQLG VQ 
VATSNGG NKAETPRFVSR 
*RRVTAATR RRPRGSSRG 

AGT GGC GGC ATG ACA ACG GCG GCA AGA AGC GGA GCC AGC CGG ACT TCT GGC TGG 
_ 16047 16056 16065 16074 16083 16092 

iWtCA CCG CCG TAC TGT TGC CGC CGT TCT TCG CCT CGG TCG GCC TGA AGA CCG ACC 

S P P Y CCRRSSPRSA*RPT. 
HRRTVAAVLRLGRPEDRP 
TAV LLPPFFASVGLKTDL 

Q LEAPAAAGQPHPGADGQ 
S CS. PRPPPARHTHAPTAR 
AAVRGPRRRGTPTPRRRG 

ACG ACG TTG AGC CGG CCC CGC CGC CGC GGG ACA CCC ACA CCC GGC CGC AGC GGG 
16101 16110 16119 16128 16137 16146 

TGC TGC AAC TCG GCC GGG GCG GCG GCG CCC TGT GGG TGT GGG CCG GCG TCG CCC 

CCNSAGAAAPCGC GPASP 
AATRPGRRRPVGVGRRRP 
LQLGRG. GGALWVWAGVAL 
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QH GDDAFQRAARRCRRQH 
STATTPLSAPL.AAAAAS I 
APPRRRCVPPCRPPLPAS 



ACG ACC ACC GGC AGC AGC COT TTG ACC GCC CGT CGC GCC GCC GTC GCC GCG ACT 
16155 16164 16173 16182 16191 16200 

TGC TGG TGG CCG TCG TCG GCA AAC TGG CGG GCA GCG CGG CGG CAG CGG CGC TGA 

CWWPSSANWRAARRQRR* 
AGGRRRQTGGQRGGSGAD 
LVAVVGKLAGSAAAAALM 

RHLADVGQADAHE HVAAS 
DTSRTSA RRMPTSMFQRP 
TPPARRRGACRRA* SSGR 

ACA GCC ACC TCG CGC AGC TGC GGG ACG CGT AGC CGC ACG AGT ACT TGA CGG CGC 
16209 16218 16227 16236 16245 16254 

TGT CGG TGG AGC GCG TCG ACG CCC TGC GCA TCG GCG TGC TCA TGA ACT GCC GCG 

CRWSAS TP CASAC S * TAA 
^ VGGARRRPAHRRAHELPR 
SVERVDALRIGVLMNC RG 

QGFQHDE GDPEFEADQCG 
SVSSTIRVMPSSSPTRVG 
VSRVP S G * WRARVRR G SV 

CTG ACT GGC TTG ACC ACT AGG AGT GGT AGC CCG AGC TTG AGC CGC AGG ACT GTG 
16263 16272 16281 16290 16299 16308 

GAC TGA CCG AAC TGG TGA TCC TCA CCA TCG GGC TCG AAC TCG GCG TCC TGA CAC 

D*PNW*SSPSGSNSAS*H 
TDRTGDPHHR ARTRRPD T 
LTELVILTIGLELGVLTP 

RQEGHQDDDGQAGGDHGR 

ANNVMSTMTVRHAVTMVA 

R TT*WAP *R*GTRWR*SR 
_ _ 

"^"''GGC GCA ACA AGT GGT ACG ACC AGT AGC AGT GGG ACA CGC GGT GGC AGT ACT GGC 
16317 16326 16335 16344 16353 16362 

CCG CGT TGT TCA CCA TGC TGG TCA TCG TCA CCC TGT GCG CCA CCG TCA TGA CCG 

PRCSPCWSSSPCAPP S*P 
RVVHHAGHRHPV RH .RHDR 
ALFTMLVIVTLCATVMTA 

RQEVQEVAGLR A G R G G T C 
GSSSRSSRASARVAGARV 
AAARGARGRRPACRARGY 



GCG GCG ACG AGC TGG ACG AGC TGG CGC 
16371 16380 16389 

CGC CGC TGC TCG ACC TGC TCG ACC GCG 



GGC TCC GCG CGT GGC GCG GGC GGG CAT 
16398 ^ 16407 16416 

CCG AGG CGC GCA CCG CGC CCG CCC GTA 
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R - R*^ S*-- 'T " C ' S ' ' A" • • P .'^ RV^ R^ A pr> r- p p v 

AAARPARPRRGAHRARPY 
PL LDLLDRAEARTAPART 

FRTGDNASSPAAFEARS I 
FALETTRQRRHPSNQGPF 
LLSNRRESVVTRRIRGPF 

GTT TTC GCT CAA GGC AGC AAG CGA CTG CTG CCA CGC CGC TTA AGA CGG GCC CTT 
16425 16434 16443 16452 16461 16470 

CAA AAG CGA GTT CCG TCG TTC GCT GAC GAC GGT GCG GCG AAT TCT GCC CGG GAA 

QKRVPSFADDGAANSARE 
KSEF RRS LTTVRR I LPGK 
KASSVVR*RRCGEFCPGN 

GSRT*TI GELIGVFR QSH 
APAPRPSERLFVSLVSVI 
HRLPDLHNG*SYRCFAS * 

TAC GGC CTC GCC CAG ATC CAC TAA GGG AGT TCT TAT GGC TGT TTT GCG ACT GAT 
16479 16488 16497 16506 16515 16524 

>jfc^TG CCG GAG CGG GTC TAG GTG ATT CCC TCA AGA ATA CCG ACA AAA CGC TGA CTA 

JfcL 

f^^K> — 

MPERV*VIPSRIPTKR*L 
CRSGSR* FPQEYRQNADY 
AGAGLGD SLKNTD KTLTM 

DDFSHLDTRAPDLLG .SFL 
ITLLICIRARRTWYAQFC 
SR*FFASGHAGPGTLRFV 

ACT AGC AGT TTT CTT ACG TCT AGG CAC GCG CGG CCC AGG TCA TTC GGA . CTT TTG 
16533 16542 16551 16560 16569 16578 

TGA TCG TCA AAA GAA TGC AGA TCC GTG CGC GCC GGG TCC AGT AAG CCT GAA AAC 

*SSKECRSVRAGSSK .PEN 
DRQK NAD PCAP G P V S L K T 
i * IVKRMQIRARRVQ*A*KQ 

I^P^ STPQHLYGVQ VDTSEADE 
P P P- N : T C I A S R Y M -P A R P T K 
P L H T P A S L R G T C R H E R R R 

TCC CTC CAC CCA ACC ACG TCT ATC GGC TGG ACA TGT AGC CAC GAG AGC CGC AGA 
16587 16596 16605 16614 16623 16632 

AGG GAG GTG GGT TGG TGC AGA TAG CCG ACC TGT ACA TCG GTG CTC TCG GCG TCT 

REVGWC .R * PTCT S V L SA S 
G R W V ADSRPVH RCSRRL 

G G G L (yj QIADLYIGALGVF 

V> 

YRRTHADFPGHFAAEIR G 
TGGHTLTS. HATSRPR*GA 
RVATHSRRIPRPVRGRDP 



AGC ATG GCG GCA CAC ACT CGC AGC TTA CCC GGC ACC TTG CGC CGG AGA TAG GCC 
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TCG TAG CGC CGT GTG TGA GCG TCG AAT GGG CCG TGG AAC GCG GCC TOT ATC CGG 



SYRRV*ASNGPWNAASIR 
RTAVCERRMGRGTR P LSG 
VPP. CVSVEWAVERGLYPA 

FLGLCVLEAPDGYGAVDG 
SSASACSSPPTAMAPSTG 
RLPRPVRARRPRWLRRRG 

GGC TTC TCC GGC TCG GTG TGC TCG AGC CGC CCC AGC GGT ATC GGC CGC TGC AGG 
16695 16704 16713 16722 16731 16740 

CCG AAG AGG CCG AGG CAC ACG AGC TCG GCG GGG TCG CCA TAG CCG GCG ACG TCC 

PKRPRHTSSAGSP*P ATS 
RRGRGTRARRGRHSRRR P 
EEAEAHELGGVAIAGDVP 

RRFHGQ. PRRL LRHLPPAS 

G G S I A K R AA CCA T F L H 

GEPFPRAPP AAPPS S TP R 
•'\ _ . 

Mg^^G GAG GCC TTT ACC GGA ACG CCC GCC GCG TCG TCC GCC ACT TCT CCA CCC CGG 
16749 16758 16767 16776 16785 16794 

CCC CTC CGG AAA TGG CCT TGC GGG CGG CGC AGC AGG CGG TGA AGA GGT GGG GCG 

PLRKWPCGRRSRR*RGGA 
P S GN G L A G GAA G G E E V GR 
PPEMALRAAQQAVKRWGG 

RRRFE IQQQIRAGPVLAR 
DGVSNS RSSYALVQCWPG 
lASPIRDAATHSCRAGPG 

CTA GCG GCT GCC TTA AGC TAG ACG ACG ACA TAG GCT CGT GGA CCG TGG TCC CGG 
16803 16812 16821 16830 16839 16848 

GAT CGC GGA CGG AAT TCG ATC TGC TGC TGT ATG GGA GCA CCT GGC ACC AGG GCC 



^yJS' R RRN S I CCCMRAP G TRA 
I . A D G I R S A A V C E H L A P G P 



S P T E ,F D L L L Y A. T W-H Q G P 

V^APRGLCV QLPVQHAPVH 
SPQGGWAYRCR CRTPPSM 
PRSAAGPMGAAAGPPRPC 

GCC TGC GGA CCG GCG GGG TCC GTA TGG ACG TCG CCG TGG ACC ACC CGC CCC TGT 

16857 16866 .16875 16884 16893 16902. 

CGG ACG GCT GGC CGC CCC AGG CAT ACC TGC AGC GGC ACC TGG TGG GCG GGG ACA 

RTAGRPRHTCSGTWWAGT 
GRLAAPG IPAAAPGGRGH 
DGW PPQAYLQRHLVGGDM 

EGQLDPLAAVAHEARQFE 
SAR .S I L CPQLPT NL A S S S 
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ACG AGC GGG ACC TCT AGT CCG TCC CGA CGT TGC CGC ACA AGT CGC GOG ACC TTG 
16911 16920 16929 16938 16947 16956 

TGC TCG CCC TGG AGA TCA GGC AGG GCT GCA ACG GCG TGT TCA GCG CGC TGG AAC 

CSPWRSGRAATACSARWN 
ARPGDQAGLQRRVQRAGT 
LALEIRQGCNGVFSALEL 

GDA.VQLGIRVAGARQDDG 
ATP*RCASGFRVLASITA 
RRRSG APRDSGCWRASR R 

AGC GGC AGC CGA TGG ACG TCC GGC TAG GCT TGG CGT GGT CGC GCG ACT AGC AGC 
16965 16974 16983 16992 17001 17010 

tcg ccg tcg gct acc tgc agg ccg atc cga acc gca cca gcg cgc tga tcg tcg 

spsat crp irtapar * ss 
rrr lpagrsephqradrr 
avgy l qad pnrt s a l i v a 

' ^.gvvvsrrqdvpp phagae 
^^■j0/^^ sl*pvgsisrhripgpk 
/'"rrcsrfaasrgtas p grs 

ggc ggc tgt tga tgc ctt gcg gcg act agc tgg cca ccg cct acc cgg ggc cga 

17019 17028 17037 17046 17055 17064 

CCG CCG ACA ACT ACG GAA CGC CGC TGA TCG ACC GGT GGC GGA TGG GCC CCG GCT 

PPTTTERR*STG GGW APA 
RRQLRNAADRPVADGPRL 
ADNY GTPLIDRWRMGPGF 

DAAIRERGP AALPGAE GP 
M PP S AS GG QHQLR GPKAR 
*RRRHAGARTS.CAAR SR G 

AGT AGC CGC CGC TAC GCG AGG GCG GGA CCA CGA CGT TCG CCG GGC CGA AGC GGG 
.4 17073 17082 17091 17100 17109 17118 

.:^|jPg!"A TCG GCG GCG ATG CGC TCC CGC CCT GGT GCT GCA AGC GGC CCG GCT TCG CCC 

S S A A M R S R P G A A S G P A S P 
HRR RCAPALV LQAARLRP 
IGGDAL PPWCCKRPGFAR 

EARHGGLPQRLDLRQVAT 
SQETAELPSGSISD SCRP 
ARSP PRWPAAPSRTAA. GR 

CCG AGA CGA GCC ACC GGA GGT TCC CCG ACG GCC TCT AGC TCA GCG ACG TGG CGC 
17127 17136 17145 17154 17163 17172 

GGC TCT GCT CGG TGG CCT CCA AGG GGC TGC CGG AGA TCG AGT CGC TGC ACC GCG 

GSARWPPRGCRRSSRCTA 
ALLGGLQGAAGDRVA APR 
LCSVASKGLPEIESLHRG 

-67- 



VLRQERRADGPATGGVEA 
SSGNNG GLMVRPRAVSKL 
HRATT GASC*GPGHWRS * 



CAC TGC TCG GCA ACA AGG GCG GCT CGT 
17181 17190 17199 

GTG ACG AGC CGT TGT TGC CGC CGA GCA 



AGT GGG CCC CGG CAC GGT GGC TGA AGT 
17208 17217 17226 

TCA CCC GGG GCC GTG CCA CCG ACT TCA 




CGC GGG CAT AGC CGG TCG TCA AGC GGT 
17235 17244 17253 

GCG CCC GTA TCG GCC AGC AGT TCG CCA 



GGG CGT CGG GGC GGA AGC AAC GCT ACC 
17262 17271 17280 

CCC GCA GCC CCG CCT TCG TTG CGA TGG 




GGC TCT AAG TCC TGG TAT ACT ACC TGC ACC GGC TCG CGC GGG ACC GGC CCC GGC 
17289 17298 17307 17316 17325 17334 

CCG AGA TTC AGG ACC ATA TGA TGG ACG TGG CCG AGC GCG CCC TGG CCG GGG CCG 

PRFRT I *WTWPSAPWPGP 
RD S GPY D GR GR. AR P GR.GR 
E I Q D H M M D V A E R A L A G A G 

DPHRV DGADGEHV .IVRL P 
/M PIASTARTEKMF**AFH 
^j^C RSPPRRG .RRR* S SDR S T 

CGT AGC CCT ACC GCC TGC AGC GGG CGC AGA GGA AGT ACT TGA TAG TGC GCT TCA 
17343 17352 17361 17370 17379 17388 

GCA TCG GGA TGG CGG ACG TCG CCC GCG TCT CCT TCA TGA ACT ATC ACG CGA AGT 

ASGWRTSPASPS*TITRS 
HRDGGRRPRLLHELSREV 
IGMADVARVSFMNYHAKW 

RATSFPPRPPAATGTWTP 
DLLASHRGPPHRQGPGRP 
TSCHQIAAQPTGSDRDVH 



CCA GCT CGT CAC GAC TTA CCG CCG GAC 
17397 17406 17415 

GGT CGA GCA GTG CTG AAT GGC GGC CTG 



CCC CCA CGG CGA CAG GGC CAG GTG CAC 
17424 17433 17442 

GGG GGT GCC GCT GTC CCG GTC CAC GTG 
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G" R- A V " N G G' E ' G G A * -A - v' - P 'V* H V 

V E Q C * M AAWGVP L S R S T W 
S SSAEWRP GGCRCPGPRG 

I RGP S R G S APGAVMQ Q GH 
FEAPLDAVQPALSWRSDM 
SNPRSI PWKRPWRGDATW 

CCT TAA GCC GGC CCT CTA GCC GGT GAA CGC CCC GGT CGC TGG TAG ACG ACA GGT 
17451 17460 17469 17478 17487 17496 

GGA ATT CGG CCG GGA GAT CGG CCA CTT GCG GGG CCA GCG ACC ATC TGC TGT CCA 

GIRPGDRPLAGPATICCP 
EFGREI GHLRGQRPSAV H 
NSAGRSATCGASDHLLSM 

FVDYPGTLEGGAVVDQLE 
SCMTR VPSSAGPSWTRCS 
PVC RVSRH ARGRRGRGAV 

ACC TTG TGT AGC ATG CCT GGC CAC TCG AGC GGG GGC CGC TGG TGC AGG ACG TTG 
17505 17514 17523 17532 17541 17550 

^ TGG AAC ACA TCG TAC GGA CCG GTG AGC TCG CCC CCG GCG ACC ACG TCC TGC AAC 

-m^'^" 

' * W NTSYGPVSSPPATTSCN 
G T H R T D R * A R P R R P R P A T 
E HIVRTGELAPGDHVLQL 

GRGRAQHHGAGDKLNE FR 
AVAGPR TTDLATR * TR S D 
RWPGPGPPTWRRGEPERI 

AGC GGT GCC GGG GCC CGG ACC ACC ACA GGT CGC GGC AGG AAG TCC AAG AGC TTA 
17559 17568 17577 17586 17595 17604 

TCG CCA CGG CCC CGG GCC TGG TGG TGT CCA GCG CCG TCC TTC AGG TTC TCG AAT 

SPRPRAWWCPAPSFRFSN 
R H GP GP G GVQRR P S G S R I 

^ATAPG LVVSSAVLQVLES 

'3(1 RVPV FS S.YRC RRVSYARS 
' G S Q S S H H I G A V . V F P I H G H 
A PSPRI IFVPLS S RFI GT 

GCG GCC TGA CCC TGC TTA CTA CTT ATG GCC GTT GCT GCT TGC CTT ATA CGG GCA 
17613 17622 17631 17640 17649 17658 

CGC CGG ACT GGG ACG AAT GAT GAA TAC CGG CAA CGA CGA ACG GAA TAT GCC CGT 

R R T G T N„„^ DEYRQRRTEYAR 
A G L G R (My M N T G N D E R N M P V 
P D W D E * * PATTNGICP* 

IGQDGPPSGREPPRPRSR 
YGKIARRVGERRHGHDPD 
IDRSRGASEREGTATTPI 



CTA TAG GGA ACT AGC GGG CCG CCT GAG GGA GAG AGG CCA CCG GCA CCA GCC CTA 
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1^76^7- -^^^^^ -17676-^- -^17605- 17694-- - 1770^3^^ 17712 

GAT ATC CCT TGA TCG CCC GGC GGA CTC CCT CTC TCC GGT GGC CGT GGT CGG GAT 



DIP*SPGGLPLSGGRGRD 
ISLDRPADSLSPVAVVGI 
YPLIARRTPSLRWPWSGS 

IGTGRHH*SARRIRPGTS 
SAPEGTTDVRGAFEPVQQ 
PHRNGPPTLEGPSNQSRN 

GGC TAG GGC CAA GGG GGC ACC ACA GTT GAG CGG GCC GCT TAA GAC CCT GGA CAA 
17721 17730 17739 17748 ' 17757 17766 

CGG ATG CGG GTT CCC CGG TGG TGT CAA CTC GCC CGG CGA ATT CTG GGA CCT GTT 

RMPVPRWCQLARRILGPV 
G CRFPGGVNSPGEF WDLL 
DAGSPVVSTRPANSGTC * 

P RV C C R RRSAGR G S P L T G 
RGSAVGDALHGGVAPFLV 
VAPRLVTPSIGGSR QS SY 

JPfcO?G CCG GCC TGC GTT GTG GCA GCC GCT CTA CGG GGG GCT GGC GAC CCT TCT CAT 
17775 17784 17793 17802 17811 17820 

GAC GGC CGG ACG CAA CAC CGT CGG CGA GAT GCC CCC CGA CCG CTG GGA AGA GTA 

DGRTQHRRRDAPR PLGRV 
TAGRNTVGEMPPDRWE EY 
RPDATPSARCPPTAGK.ST 

PS RD ATRHPAASPSESRC 
P^VETRPEIRRQPRRN A GA 
R SKPGRNSAASRVAIREP 

GGC CCT GAA GCC AGG CGC CAA GCT ACG CCG CGA CGC CTG CCG CTA AGC GAG GCC 
17829 17838 17847 17856 ' 17865 17874 

CCG GGA GTT CGG TCC GCG GTT CGA TGC GGC GCT GCG GAC GGC GAT TCG CTC CGG 

^P GLRSAVRCGAADGD S LR 
RDFGPRFD AAL RTAIRSG 
G T S V R G S M R R C G R R ..F A P A 

NGPRRCLPNR RRTRRCRA 
TEQVVVYRTEVGLEEADR 
LKR .SSSMAPKSASNKPME 

GTC AAA GGA CCT GCT GCT GTA TCG CCC AAA GCT GCG GCT CAA GAA GCC GTA GAG 
17883 17892 17901 17910 17919 17928 

CAG TTT CCT GGA CGA CGA CAT AGC GGG TTT . CGA CGC' CGA GTT GTT CGG CAT CTC 

QFPGRRHSGFRRRVLRHL 
SFLDDDIAGFDAEFFGIS 
VSWTTT*RVSTPSSSASR 

ARPRASPGAAAGSAPPPR 
RALGL QHVRLLAQHQLHG 
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CGG CGC GCT CCG GCT CGA CTA CCT GOG CGT CGT CGC GGA CTA CGA CCT CCA CCG 
17937 17946 17955 17964 17973 17982 

GCC GCG CGA GGC CGA GCT GAT GGA CCC GCA GCA GCG CCT GAT GCT GGA GGT GGC 



AARGRADGPAAAPDAGGG 
PREAELMDPQQRLMLEV A 
RARPS*WTRSSA*CWRWP 

APVPARPCGAACGPLSRC 
PLCQLVRADRRVGQCPGV 
QCASSCAPMGGCVRAPVS 

GAC CGT CCG TGA CCT CGT GCG CCC GTA GGG CGG CGT GTG GGA CCG TCC CTG GCT 
17991 18000 18009 18018 18027 18036 

CTG GCA GGC ACT GGA GCA CGC GGG CAT CCC GCC GCA CAC CCT GGC AGG GAC CGA 

LAGTGA RG HPAAHPGRDR 
W QALEHAGIPPHTLAGTD 
GRHWSTRASRRTPWQG P T 

R H T R R P R C R R S H R.R V A P L 
JIP^^G TH EGPDAGVVIAGSPQF 
•'VPTNAPTQV*S*PAPRS S 

GTG GCC ACA CAA GCG GCC CCA GAC GTG ,GAT GCT GAT ACC GCG GCC TGC CGA CCT 
18045 18054 18063 18072 18081 18090 

CAC CGG TGT GTT CGC CGG GGT CTG CAC CTA CGA CTA TGG CGC CGG ACG GCT GGA 

HRCVRRGLHLRLWRRTAG 
TGVFAG V CTYDYGAGRLE 
PVCSP GSAPTTMAPDGWK 

GAS C R RM SPSRR P. P T R R T 
VQRVDVCPRPDARR HAGH 
SR GFMSAHVPIPAATHAT 

,TCT GGA CGG CTT GTA GCT GCG TAC CTG CCC CTA GCC GCG CCG CCA CAC GCG GCA 
18099 18108 18117 18126 18135 18144 

^jH^JGA CCT GCC GAA CAT CGA CGC ATG GAC GGG GAT CGG CGC GGC GGT GTG CGC CGT 

RPAE HRRMDG D R R G G V R R 
D. LPNIDAWTGIGAAVCAV 
TCRT STHGRGSARRCAP C 

WGRRER ARGA RAW .gr WR C 
G VADRVREVQAPGAEGDV 
D L R T E * A S S R R P G L R E M S 

CAG GTT GGC GCA GAG AGT GCG CGA GCT GGA CGC GCC CGG GTC GGA GAG GTA GCT 
18153 18162 18171 18180 18189 18198 

GTC CAA CCG CGT CTC TCA CGC GCT CGA CCT GCG CGG GCC CAG CCT CTC CAT CGA 

VQPRLSRARPARAQPLHR 
SNRVSHALDLRGPSLSID 
PTAS LTR STCAGP A S P S T 
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RTSPRGPPAACRRASGAA 
GRARGGQHRQVGGRLAQP 
VAHEAERTASCVAACLRR 

GTG GCG CAC GAG CCG. GAG GGA CCA CCG CGA CGT GTG GCG GCG CGT CTC GGA CGC 
18207 18216 18225 18234 18243 18252 

CAC CGC GTG CTC GGC CTC CCT GGT GGC GCT GCA CAC CGC CGC GCA GAG CCT GCG 

HRVLGLPGGAAH RRAEPA 
TACSASLVALHTAAQSLR 
PRARPPWWRCTPPRRACG 

RRTCRPAPRPR*G -APTVP 
EALAGHRQGPADVQ.QH*R 
SPSHVTASAPPTLRSTDG 

CGA GCC GCT CAC GTG GCA CCG CGA CCG GCC CCC GCA GTT GGA CGA CCA CAG TGG 
18261 18270 18279 18288 18297 18306 

GCT CGG CGA GTG CAC CGT GGC GCT GGC CGG GGG CGT CAA CCT GCT GGT GTC ACC 

I A R RVHR GAGR GR Q P A G V T 
',.L G E C T V A L A G O V N L L V S.P 
SASAPWRWPGASTCWCHR 

GSSRGPCPRRAPARRGSC 
-ALRDGQARGA RQRGVAPA 
PWVIARPVAPASAGSPRL 

CCC GGT CTG CTA GCG GGA CCC GTG CCG GCC GCG CGA CCG CGG GCT GCC GGC CTC 
18315 18324 18333 18342 18351 18360 

GGG CCA GAC GAT CGC CCT GGG CAC GGC CGG CGC GCT GGC GCC CGA CGG CCG GAG 

G PDDRPGHGRRAGARRPE 
GQTIALGTAGALAPDGRS 
ARRSPWARPARWRPTAGA 

ATRRTPRVSRRQRTPRRS 
;^LREGRRGSAVGNGRRGVA 
/L G.N A A D A P R * A T A A D A S P 

GTT CGG CAA GCG GCG CAG CCG GCC TGC GAT GCG GCA ACG GCG CAG. CCG GCT GCC 
' 18369 18378 18387 18396 18405 18414 

CAA GCC GTT CGC CGC GTC GGC CGG ACG CTA CCic CGT TGC CGC GTC GGC CGA CGG 

QAVRRVGRTLRRCRVGRR 
KPFAASAGRYAVAASADG 
SRSPRRPDATPLPRRPTA 

RGRRPSRRAP* *A AS PRR 
V AAA LA A AH Q DD L Q Q R V G 
*PRPSPQPTSTMLSSVSA 

GAT GCC GGC GCC GCT CCC GAC GCC GCA CGA CCA GTA GTT CGA CGA CTG CCT GCG 
18423 18432 18441 18450 18459 18468 

CTA CGG CCG CGG CGA GGG CTG CGG CGT GCT GGT CAT CAA GCT GCT GAC GGA CGC 
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YGRGEGCGVLVIKLLTDA 
TAAARAAACWSSSC*RTP 

VRRHGPAPPAARCRT*GP 
YAVTVPHQRHQAAAREVL 
TRSPSR TSATSRPLANLW 

GCA TGC GCT GCC ACT GGC CCA CGA CCG CCA CGA CGC GCC GTC GCG CAA GTT GGT 
18477 18486 18495 18504 18513 18522 

CGT ACG CGA CGG TGA CCG GGT GCT GGC GGT GCT GCG CGG CAG CGC GTT CAA CCA 

RTRR*PGAGGAARQRVQP 
VRDGDR VL AVLRG SAFNQ 
YA TVTGCWRCCAAAR STR 

RACWRC*PGRRAPGPAR* 
VPAGVADHGGAPL GLLVD 
SPR VLPMMAGQPCAWSCT 

CCT GCC CGC GTG GTT GCC GTA GTA CCG GGG GAC GCC CGT CCG GGT CCT CGT GCA 
18531 18540 18549 18558 18567 18576 

GGA CGG GCG CAC CAA CGG CAT CAT GGC CCC CTG CGG GCA GGC CCA GGA GCA CGT 

/m.-^^ 



^ GRAHQRHHGPLRAGPGAR 
DGRTNG IMAPCGQAQEHV 
.TGAPTASWPPAGR PRS T S 

sargsprprrqrcrqsr;^ r 

HPAGQRGRADSGVGNVErD 
M L R A R V A A P T AA S V T S k't' 

GTA CTC CGC GCG GGA CTG CCG GCG CCC GCA GCG ACG GCT GTG GCA ACT GAA GCA 
18585 18594 18603 18612 18621 18630 

CAT GAG GCG CGC CCT GAC GGC CGC GGG CGT CGC TGC CGA CAC CGT TGA CTT CGT 

H E AR P D GR G RRC R H R * L R- 
M RRALTAAGVAADTVD F V 
J* GA P * R P R A S L P T P L T S S 

PGRCRYGGRR GWP SRRSR 
L G V A GTG A E A _V G H L . D A R - D 
S A W P V P V R R P S G M S I P A I 

GCT CCG GGT GCC GTG GCC ATG GGC GGA GCC GCT GGG GTA CCT CTA GCC GCG CTA 
18639 18648 18657 18666 18675 18684 

CGA GGC CCA CGG CAC CGG TAC CCG CCT CGG CGA CCC CAT GGA GAT CGG CGC GAT 

RGPRHRYPP RRPHGDRRD 
EAHGTGTRLGDP MEIGAI 
RPTAPVPA SATPWRSARS 

RRRRVHGSRDPATRPRTP 
GGDVSTVAGTLLRARDPR 
AAT*.PRSREP*SGHATPD 



GCG GCG GCA GAT GCC TGC ACT GGC GAG GCC AGT CCT CGG CAC GCG CCA GCC CAG 
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1 8693 1 8702^ - T 8TT • T 8720 -"^ ' ' 1 8729 ' 187 38 

CGC CGC CGT CTA CGG ACG TGA COG CTC CGG TCA GGA GCC GTG CGC GGT CGG GTC 



RRRLRT*PLRSGAVRGRV 
AAVYGRDR SGQEP CA VG S 
PPSTDVTAPVRSRARSGR 

STWCRADPPPRRPRRP* * 
HLGVDPMQLPGGP DGPDD 
TFDLMPCRSPAAPTAPTM 

CCA CTT CAG GTT GTA GCC CGT AGA CCT CCC CCG GCG GCC CCA GCG GCC CCA GTA 
18747 18756 18765 18774 18783 18792 

GGT GAA GTC CAA CAT CGG GCA TCT GGA GGG GGC CGC CGG GGT CGC CGG GGT CAT 

GEVQH RASGGG RRGRRGH 
VKSNIGHLEGAAGVA GVI 
*SPTSGIWRG .PPGSPGS S 

PSGRGR RPGSGPWGAPRR 
LRDEGEVLVPDRGAQQ VA 
LA I RA R S S S R I GA L R S S P 

|(i&TT CCG CTA GGA GCG GGA GCT GCT CCT GGC CTA GGG CCG GTC GGA CGA CCT GCC 
18801 18810 18819 18828 18837 18846 

CAA GGC GAT CCT CGC CCT CGA CGA GGA CCG GAT CCC GGC CAG CCT GCT GGA CGG 

QGDPRPRRGPDPGQPA GR 
KAILALDEDR I P A S L L D G 
RRSSPSTRTGSRPACWTA 

GSGR SRSPRGRCGAPSGP 
VRVGLDVPGAEVDPQRGP 
S G F G S I S Q A P R S M R.S A V R. 

GCT GGG CTT GGG GCT CTA GCT GAC CCG GCC GGA GCT GTA GGC CGA CCG CTG GGC 
' 18855 18864 18873 18882 18891 18900 

CGA CCC GAA CCC CGA GAT CGA CTG GGC CGG CCT CGA CAT CCG GCT GGC GAC CCG 

f~~ ■ ■ 

^ R P E P R D R L G R P R H P A G D P 

:J| ■ DPNPEIDWAGLDI RLATR 

T R T P. R S.T G P A S .T. S G W R P G 

GATARADAGGGPPQTRN R 
GQRPGLTRVGAPRSHGTE 
ARGHGS^RGCGRRAATDPK 

CCG GGA CGG CAC CGG GCT CGC AGG CGT GGG GGC GGC CCG CCG ACA CAG GCC AAA 
18909 18918 18927 18936 18945 18954 

GGC CCT GCC GTG GCC CGA GCG TCC GCA CCC CCG CCG GGC GGC TGT GTC CGG TTT 

GPAVARASAPPPGGCVRF 
ALPWPERPHPRRAAVSGF 
PCRGPSVRTPAGRLCPVS 

SRRCR PGHPGRVPAWRAR 
AVAAGHGMHDEFL RGGRG 
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GCC GAT GCC GCC GTG GCA CCG GGT ACA CCA GGA GCT TGT CCG CGG GTG GCG CGG 
18963 18972 18981 18990 18999 19008 

CGG CTA CGG CGG CAC CGT GGC CCA TGT GGT CCT CGA ACA GGC GCC CAC CGC GCC 

RLRRHRGPCGPRTGAHRA 
GYGG. TVA HVVLEQAPTAP 
ATAAPWP MWSSNRRPPRp 

GGRAPAPRFGTGPTRPR G 
GAGRRLRGSGQERHGRGG 
ARGAGSGAPVRNGTDAAE 

GCG GGC GGG GCG CGG CCT CGG CCG GCC TTG GGA CAA GGG CCA CAG GCG CCG GAG 
19017 19026 19035 19044 19053 19062 

CGC CCG CCC CGC GCC GGA GCC GGC CGG AAC CCT GTT CCC GGT GTC CGC GGC CTC 

RPP RAGAGRNPVPGVRGL 
ARPAPEPAGTLFPVSAAS 
PAPRRSRPEPCSRCPRPP 

,^.PPAGHGRPRARRAPRPPR 
L RETVARGREGIiPDLL A 
' G SA S R S RA.AA SA S R T S S P 

GGG CCT CCG CGA GGC ACT GGC GCG CCG GCG CGA GCG GCT CGC CCA GCT CCT CCC 
19071 19080 19089 19098 19107 19116 

CCC GGA GGC GCT CCG TGA CCG CGC GGC CGC GCT CGC CGA GCG GGT CGA GGA GGG 

PGGAP*PRGRARRAGRGG 
PEALRDR AAALAERVEEG 
R RR S VT ARPRSP S G S R R A 

Q G P R P R AcC G P G D A T G A P G 
SVQGRDPVGQGMPLGRQD 
ASRAETPCVRAW RCDGST 

. GCG ACT GGA CCG GAG CCA GCC CGT GTG GGA CCG GGT AGC CGT CAG GGG CGA CCA 
;) 19125 19134 19143 19152 19161 19170 

^jp^GC TGA CCT GGC CTC GGT CGG GCA CAC CCT GGC CCA TCG GCA GTC CCC GCT GGT 

R * P G L G R A H P G P S A V P A G 
ADLASVGHTLAHRQSPLV 
LTWPRSGTPWPI GSPRWS 

GPPRRPSRGPRV PRRAAR 
VPRGDHRGAPVFQGGPQA 
WRAATTAVPRSSSAAP'SR 

GGT GGC CCG CCG GCA GCA CCG CTG GCC GGC CCT GCT TGA CCG GCG GCC CGA CGC 
19179 19188 19197 19206 19215 19224 

CCA CCG GGC GGC CGT CGT GGC GAC CGG CCG GGA CGA ACT GGC CGC CGG GCT GCG 

PPGGRRGDRPGRTGRRAA 
HRAAVVATGRDE LA AGLR 
TGRPSWRPAGTNWPPGCA 

-75- 



APWEPVRARDR*R PRAAP 
RQGSLFGRGTEDGPGRQR 
ASAV*SGAGPRTVPAASG 



GCG CGA CCG GTG AGT CCT TGG GCG CGG GCC AGA GCA GTG GCC CCG GCG CGA CGG 
19233 19242 19251 19260 19269 19278 

CGC GCT GGC CAC TCA GGA ACC CGC GCC CGG TCT CGT CAC CGG GGC CGC GCT GCC 

RAGHSGTRARSRHRGRAA 
ALATQEPAPGLVTGAAL P 
RWPLRN, PRPVSSPGPRCR 

HRGDRRPTRPDRTGTPRS 
IGATGDPHERTVPGLPGP 
S APRGTQTNEP* PDWHAP 

CCT ACG GCC GGC AGG GCA GAC CCA CAA GAG CCC AGT GCC CAG GGT CAC CCG GCC 
19287 19296 19305 19314 19323 19332 

GGA TGC CGG CCG TCC CGT CTG GGT GTT CTC GGG TCA CGG GTC CCA GTG GGC CGG 

GCRP S RLGVLGS RVPVGR 
^DAGRPVWVFSGHGSQWAG 
M PAVP S G C SRVT GP S G P G 



PGRVAPLRAPRRRPSRRV 
^HA AFQQFGLRDEGLHDVF 
I PRS S S SA S GTK A S T I S S 

CTA CCC GGC GCT TGA CGA CCT TCG GCT CGG CCA GAA GCG GCT CCA CTA GCT GCT 
19341 19350 19359 19368 19377 19386 

GAT GGG CCG CGA ACT GCT GGA AGC CGA GCC GGT CTT CGC CGA GGT GAT CGA CGA 

DGPRTAGSRAGLRR. GDRR 
M G R E L L E A E P V F A E V I D E 
WAANCWKPSRSSPR*STN 

PAPT*PPSRTRAGASAA P 
QLRHELLLDPERGPLH QQ 
OS SGTNLSSIPNEGRCISS 

'tGA CCT CGG CCA CAA GTT CCT CCT CTA GCC CAA GAG CGG GGC CGT CTA CGA CGA 
19395 19404 19413 19422 19431 19440 

ACT GGA GCC GGT GTT CAA GGA GGA GAT CGG GTT CTC GCC CCG GCA GAT GCT GCT 

TGA GVQ GGDRVL AP ADAA 
LEPVFKEEIGFSPRQML L 
WSR CSRRRSGSRPGRCC W 

P RGCRPRRRGS WSRRSAA 
LAVVGLDVAGLG HDERHL 
SPSWVSTSPAWVMI KAIC 



CCT CCC GCT GGT GTG GCT CCA GCT GCC 
19449 19458 19467 

GGA GGG CGA CCA CAC CGA GGT CGA CGG 



GCG GGT CTG GTA CTA GAA GCG CTA CGT 
19476 19485 19494 

CGC CCA GAC CAT GAT CTT CGC GAT GCA 
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G- . G*^-.- Rv^^p^- . R^^-. G Xi- R D A 

EGDHTEVDG AQTMI FAMQ 
RATTPRSTAPRP *SSRCJ 

RARRATATVPRRARRR*! 
EPEGRQPP*PADLGGGDD 
SPSAASHRDRPTSGAATM 

CGA GCC CGA GCG GCG CGA CAC CGC GAG TGC COG GCA GCT CGG GCG GCG GCA GTA 
19503 19512 19521 19530 19539 19548 

GCT CGG GCT CGC CGC GCT GTG GCG GTC ACG GGG CGT CGA GCC CGC CGC CGT CAT 

.AR ARRAVAVTGRRARRRH 
LGLAALWRSRGVEPAAVI 
SGSPRCGGHGASSPPPSS 

GSPRHSRRRR*RRPASRi 
AVRDTLDGGGDGGPRQGH 
PWET PSIAAATVAPASVT 

GCC GGT GAG CCA GCC ACT CTA GCG GCG GCG GCA GTG GCG GCC CCG CGA CTG GCA 
19557 19566 19575 19584 19593 19602 

, CGG CCA CTC GGT CGG TGA GAT CGC CGC CGC CGT CAC CGC CGG GGC GCT GAC CGT 

RPLGR*DRRRRHRRGADR 
G H SVGEIAAAVTAGALTV 
-ATRS VRSPPPSPPGR*P^ 

RRPGASRGYTAAAA RPRI 
GVPGPQDATPRQQQALG R 
VSPARS I QRLDS S SRS .AA 

CTG GCT GCC CCG GGC CGA CTA GAC GGC ATC CAG CGA CGA CGA CGC GCT CCG GCG 
19611 19620 19629 19638 19647 19656 

GAC CGA CGG GGC CCG GCT GAT CTG CCG TAG GTC GCT GCT GCT GCG CGA GGC CGC 

DRRGPADLP*VAAAARGR 
TDGARL ICRRSLLLREAA 
/PTGPG* SAVGRCCCARPI 

W AHRSPSP*DARRRPRRA/ 
P T A R H R H D T - Q G E V . . L - G G . L P 
PRPA I A i T LRGK S SAA SR 

CCC CGC ACC GCG CTA CCG CTA CCA GTC AGA CGG GAA GCT GCT CCG GCG GCT CGC 
19665 19674 19683 19692 19701 19710 

GGG GCG TGG CGC GAT GGC GAT GGT CAG TCT GCC CTT CGA CGA GGC CGC CGA GCG 

GAWRDGDGQSALRRGRRA 
GRGAMAMVSLPF D. EAAER 
GVARWRWSVCPSTRPPSG 

RPCHRPPRPWRTRSSTW'F 
ERAIVRHDRGDRGRRRGG 
SAPLSAT TAAMADEVVDV* 



CGA GCG CCC GTT ACT GCG CCA CCA GCG CCG GTA GCG CAG GAG CTG CTG CAG GTG 
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19719^ ": T9728* " ^ 197-37' • T9746^ - ' ^ 19755 * = 19764 

GCT CGC GGG CAA TGA CGC GOT GGT CGC GGC CAT CGC GTC CTC GAG GAG GTC CAC 



ARGQ*RGGRGHRVLDDVH 
LAGNDAVVAAIASSTTST 
SRAMTRWSRPSRPRRRP] 

SRRHGRRPRSPRRG .SSR] 
HDGTVGALDLLDDAAPGV 
TIEPSGPSTSFTTPR QVS 

GCA CTA GAG GGC ACT GGG GGC GCT CCA GCT CTT CCA GCA GCC GGC GAG CTG GCT 
19773 19782 19791 19800 19809 19818 

CGT GAT CTC GGG TGA CGC GGG CGA GGT CGA GAA GGT CGT GGG CCG CTG GAG CGA 

RDLR*PRRGREGRRPLDR 
VI .SGDPGEVEKVVGRWTD 
*SPVTPARSRRSSAAGP' 

PAPRVAPRRRRPRGCGAC 
LPQDYPP DGGVHGEVA RV 
^SPSTTRRTAESTAKWLGC 

>^pfeT CGC CGA CCA GCA TGC CGC CCA GGG GAG GCT GCA CCG GAA GGT GTC GGG CGT 
19827 19836 19845 19854 19863 19872 

cga ggg gct ggt cgt acg ggg ggt cgc ctc cga cgt ggc ctt cca cag ccc gca 

rgagrtagrlrrglpqpa 
eglvvr rvasdvafhsph 
rgwsyggspptw pstar: 

pggarga arprrrasdw] 
hvgqevpqarggvlqt ga 

MS GR S S R SRAAA S S S L. GL 

GTA CGT GGG GGA CGA GCT GGC CGA CGC GGG CCG GCG GCT GCT CGA CTC AGG GTC 
19881 19890 19899 19908 19917 19926 

CAT GGA CCC CGT GCT CGA CCG GCT GCG CGC GGC CGC CGA CGA GCT GAG TCC CAG 

V ~ — 

JiHGP P AR P AARGR R R A E S Q 
M D P L L D R LRAAAD ELSPS 
W T P C S T G C A . R P P T S . * V P 2 

VACAARCSPARPGAPWP J 
CRVRRE VRRRERVR P G.RH 
AGC VGS*VVASASGRAVT 

. GCG TGG CGT GTG CGG CGA GAT GTG CTG CCG CGA GCG CCT GGG CGC CCG GTG CCA 
19935 19944 19953 19962 19971 19980 

CGC ACC GCA CAC GCC GCT CTA CAC GAG GGC GCT CGC GGA CCC GCG GGC CAC GGT 

RTAHA ALHDGARGPAGHG 
APHTPL YTTALA DPRATV 
HRTRRSTRRRSRTRGPR^ 

RRRRTSPPSGACGPAARI 
GGVARVPRRVQAVRHPEG 

-78- 



CTG GCG OCT GCC GCG CAT GAG COG CCG CTT GGA CGC GTT GGG CCA CGC CGA GCG 
19989 19998 20007 20016 20025 20034 

GAC CGC CGA CGG CGC GTA CTG GGC GGC GAA CCT GCG CAA CCC GGT GCG GCT CGC 



DRRRRVLGGEPAQPG AAR 
TADGAYWAANLRNPVRLA 
P PTARTGRRTCATRCGSP 

RS*RPPRPRGGPTRRAT G 
GRDGRRGLVAVPREDLQG 
AAIVAAASSPWRA NTSSD 

GCG GCG CTA GTG GCG CCG CCG GCT CCT GCC GGT GGC CCG CAA GCA GCT CGA CAG 
20043 20052 20061 20070 20079 20088 

CGC CGC GAT CAC CGC GGC GGC CGA GGA CGG CCA CCG GGC GTT CGT CGA GCT GTC 

RRDHRGGRGRPPGVRRAV 
AAITAAAEDGHRAFVEL S 
P RS PRR PRTAT G.R S S S C P 

AGRPRAS S GRSAPRVRRP 
^^RVGHDRVRDVLRQGFAAH 
GC GT T A C E I W SV S A S R P T 

GGG CGT GGG GCA CCA GCG CGT GAG CTA GGT GCT CTG CGA CCG GCT TGC GCC GCA 
20097 20106 20115 20124 20133 20142 

CCC GCA CCC CGT GGT CGC GCA CTC GAT CCA CGA GAC GCT GGC CGA ACG CGG CGT 

PAPRGRALDPRDAGRTRR 
PHPVVAHSIHETLAERGV 
RTPWSRTRSTRRWPNA AW 

PRTRRVSAVACGARPGSR 
LVH E D S RR * PAVL G,L G P G 
SSTNTPGVSRRLWGSARV 

.CCT CCT GCA CAA GCA GCC TGG CTG CGA TGC CGC GTT GGT CGG GCT CCG GGC CTG 
J 20151 20160 20169 20178 20187 20196 

'pbGA GGA CGT GTT CGT CGG ACC GAC GCT ACG GCG CAA CCA GCC CGA GGC CCG GAC ' 

G G R V R R T D A T A Q P A R G P D 
EDVFVGPTLRRNQPEART 
RTCSSDRRYGATSPRPGP 

GRRRPRRGSGRRSRPSTP 
EAGGHAGGVAVAHAHVPR 
KRAATP A AWQWPTLTSQD 

GAA GGC GCG GCG GCA CCC GCG GCG GGT GAC GGT GCC GCA CTC GCA CCT GAC CAG 
20205 20214 20223 20232 20241 20250 

CTT CCG CGC CGC CGT GGG CGC CGC CCA CTG CCA CGG CGT GAG CGT GGA CTG GTC 

LPRRRGRRPLPRRER GLV 
FRAAVGAA HCHGV SVD W S 
SAPPWAPPTATA*AWTGR 
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AGASRSGRLGAARGRAAG 
RELRVPVEFDQRGVGPLV 
ASWGFPFRSTRGG*GQCC 



CCG CGA GGT CGG CTT GCC CTT GGA GCT TCA GGA CGG CGG GAT GGG GAG CGT CGT 
20259 20268 20277 20286 20295 20304 

GGC GCT CCA GCC GAA CGG GAA CCT CGA AGT CCT GCC GCC CTA CCC CTG GCA GCA 

GAPAEREPRSPAALPLAA 
ALQPNGNLEVLPPYPWQH 
RSSRTGTSKSCR. PTPGST 

GATANWRRPALPRARGRR 
ARQPTGDGPRSRGLAAVV 
RG SHREMAPARAASRPWS 

GGC GGG CGA CAC CGC AAG GTA GCG GCC CCG CGC TCG CCG GCT CGC GCC GGT GCT 
20313 20322 20331 20340 20349 20358 

CCG CCC GCT GTG GCG TTC CAT CGC CGG GGC GCG AGC GGC CGA GCG CGG CCA CGA 

^ppavafhr' rgasgrarpr 

^ RPLWRS IAGARAAERGHD 
ARCGVPSPGRERP saatt 

rsgcaapcarrrrpcrga 
dvgv rqqargaadr aavq 
tsewvsspv gpptaplsr 

GCA GCT GAG GGT GTG CGA CGA CCC GTG CGG GCC GCC GCA GCG CCC GTC GCT GGA 
20367 20376 20385 20394 20403 20412 

CGT CGA CTC CCA CAC GCT GCT GGG CAC GCC CGG CGG CGT CGC GGG CAG CGA CCT 

RRLP H AAGHARRRR G QRP 
VDS HTLLGTPGGVAGSDL 
STPTRCWARPAASRAATC 

A TACCAPRRCGGTGPCGR 
PQPVARQ VVVAARVRAAV 
RSHCLVS SSSLRGYGPLW 



""'CGC CGA CAC CGT GTC GTG CGA CCT GCT GCT GTC GGC GGG CAT GGG CCC GTC GGT 
20421 20430 20439 20448 20457 20466 

GCG GCT GTG GCA CAG CAC GCT GGA CGA CGA CAG CCG CCC GTA CCC GGG CAG CCA 

AAVAQHAGRRQPPVPGQP 
RLWHSTLDDDSRPYPGSH 
GCGTARW TTTAARTRAAT 

G*RRPSRGPRR APP*TGP 
GEVAHLDDRGGHQRDREQ 
ARLPTS I TGAAT SATVNR 



GCG GGA GTT GCC GCA CCT CTA GCA GGG 
20475 20484 20493 

CGC CCT CAA CGG CGT GGA GAT CGT CCC 



CCG GCG GCA CGA CCG CCA GTG CAA GGA 
20502 20511 20520 

GGC CGC CGT GCT GGC GGT CAC GTT CCT 
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FT P" Q*- " R ' ^ G " R- - • p^^* G ' R^ '"R^ ^ ^ G" G ' ' H V P 

ALNGVEI VPAAVLAVTFL 
PSTAWRSSRPPCWRSRSW 

PRRRPRLAGRGGP CS S SG 
RGAGLAFLAAGEL VHR HG 
AAPASPSSRRARWSMVIV 

CCG CCG GCC GCG GCT CCC GCT TCT CGC GGC GCG GGA GGT CCT GTA CTG CTA CTG 
20529 20538 20547 20556 20565 20574 

GGC GGC CGG CGC CGA GGG CGA AGA GCG CCG CGC CCT CCA GGA CAT GAC GAT GAC 

GGRRRGRRAPR PPGHDDD 
AAGAEGEERRALQDMTMT 
RPAPRAKSAAP SRT*R*p 

GPASPPDAASGPRGRPRP 
VR H QRRTLPLDLDDALAL 
WGTSVAP*R CIWTTRSPS 

GGT GGG CCA CGA CTG CCG CCC AGT CGC CGT CTA GGT CCA GCA GGC GCT CCC GCT 
20583 20592 20601 20610 20619 20628 

.CCA CCC GGT GCT GAC GGC GGG TCA GCG GCA GAT CCA GGT CGT CCG CGA GGG CGA 

PPGADGGSAADPGRPRGR 
H P V L T A G QRQIQVVR EGE 
TRC*RRVSGRS.RS.SARAR 

PA APRGSPRPR R R G S G R R 
HHPQGGPRDRVGG V RVGG 
T T R S A E R V T A S'A A S G F G A 

CCA CCA CGC CGA CCG GAG GGC CTG CCA GCG CCT GCG GCG GCT GGG CTT GGG GCG 
20637 20646 20655 . 20664 ^ 20673 20682 

GGT GGT GCG GCT GGC CTC CCG GAC GGT CGC GGA CGC CGC CGA CCC GAA CCC CGC 

GGAAG LPDGRGRRRPEPR 
VVRLASRTVADAADPNPA 
■WCGWPPGRSRTPP TRTPP 

ARGHRPGSPRAPGRRDPP 
P E D M G L G P R G- R R V E G T Q R 
QSTWASARVAAGSRA PRA 

GAC CGA GCA GGT ACG GCT CCG GGC CTG CCG GCG CGG CCT GGA GCG GCC AGA CCG 
20691 20700 20709 20718 20727 20736 

CTG GCT CGT CCA TGC CGA GGC CCG GAC GGC CGC GCC GGA CCT CGC CGG TCT GGC 

LARP CRGPDGRAGPRR SG 
W'LVHAEARTAAP DLAGLA 
GSSMPRPGRPRRTSPVWR 

A TA A P G P RA GA R V P R G R G 
RPRQQV RALVPEFRGVGA 
ARDSSSGPSCRSSGA SGP 



CCG CGC CAG CGA CGA CCT GGG CCC GCT CGT GGC CGA GCT TGG CCG GCT GGG GCC 
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20745 20754 20763 20772^ 2D78r ^ 20790 

GQC GCG GTC OCT OCT GGA CCC GGG CGA GCA CCG GCT CGA ACC GGC CGA CCC CGG 



GAVAAGPGRAPARTGRPR 
AR SLLDPGEHRLEPADP G 
RGRCWTRASTGSNRP TPi 

PRGAAPRPPRVRSRNRNJ 
QDGPPQGLHAYGRGTEI P 
RTERRSASTPTGEVPKSQ 

GGA CCA GAG GGC CGC CGA CCG GCT CCA CCC GCA TGG GAG CTG GCC AAA GCT AAC 
20799 20808 20817 20826 20835 20844 

CCT GGT CTC CCG GCG GCT GGC CGA GGT GGG CGT ACC CTC GAC CGG TTT CGA TTG 

PGL PAAGRGGRTLDRFRL 
LVSRRLAEVGVPS TGFDW 
WSPGGWPRWAYPRPVSI ( 

RRAVTRRDRHVAREPARi 
ADLSQGGTETYQVSLHER 
. LT SR S D APR PTS CA * T S E 

^^/$ekQ GCA GCT CGC TGA CAG GCG GCC AGA GCC ACA TGA CGT GCG AGT CCA CGA GAG 
20853 20862 20871 20880 20889 20898 

GAG CGT CGA GCG ACT GTC CGC CGG TCT CGG TGT ACT GCA CGC TCA GGT GCT CTC 

ERRATVRRSRCTARSGAL 
SVERLSAGLGVLHAQVL S 
ASSDCPPVSVYCTLR CSI 

RRRTRPGAAPRRS TSR A] 
GVGRGPGRQ QVGHHRDRR 
GSAE DQAGS S SAT I D I AG 

CGG GCT GCG GAG CAG GAC CCG GGG CGA CGA CCT GCG GCA CTA CAG CTA GCG CGG 
20907 20916 20925 20934 20943 20952 

GCC CGA CGC CTC GTC CTG GGC CCC GCT GCT GGA CGC CGT GAT GTC GAT CGC GCC 

T* '~ 

^, ^ARRLVLGPAAGRRDVDRA 

PDASSWAPLLDAVMS lAP 
'Jf P T P R P G P R C W T . P * C R S R I 

RRRPGGA AGCP RARRRS 
GGEHA ERLEAHDHVDVLD 
AAKTPRGCS RMTTCTSSI 

CCG GCG GAA GCA CCC GGA GGG CGT CGA GGC GTA CCA GCA CGT GCA GCT GCT CTA 
20961 20970 20979 20988 20997 21006 

GGC CGC CTT CGT GGG CCT CCC GCA GCT CCG CAT GGT CGT GCA CGT CGA CGA GAT 

GRLRGPPAAPHGRARRRD 
AAFVGLPQLRMVVHVDE I 
P PSWASRSSAWSCTSTRS 

RRRCAVP PPSPRPRARDC 
GDVA RWRLRRRD L DR E I G 
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GTG GCA OCT GCC GTG CGG TGG CCT CCG CCG CTG CCA GCT CCA GCG CGA GCT AGG 
21015 21024 21033 21042 21051 21060 

CAC CGT CGA CGG CAC GCC ACC GGA GGC GGC GAC GGT CGA GGT CGC GCT CGA TCC 




GGC GCA GCG GCT GTG GCA CGT GCG GGA CCA GTG CCT GCC CCT CCC TGC GGG CCA 
21069 21078 21087 21096 21105 21114 

CCG CGT CGC CGA CAC CGT GCA CGC CCT GGT CAC GGA CGG GGA GGG ACG CCC GGT 

PRR RHRARPGHGRGGTPG 
RVADTVHALVTDGEGRPV 
A S P T P C T PW SR T G R D A R W 

^ SGARGASGPPRA APRAPC 
Jj^y ^ AQAAQAVRHDLLRGRRV 
^' A L RR PR R * GTT S C G AA G S 



CCG CTC GGA CGC GCC GGA CGC GAT GGG CCA CCA GCT CGT CGG CCG GCG CGG CCT 
21123 21132 21141 21150 21159 21168 

GGC GAG CCT GCG CGG CCT GCG CTA CCC GGT GGT CGA GCA GCC GGC CGC GCC' GGA 




GTG GCT GCT CGG CCC GCC GCT GCG CCT GCG CCT GCA CCA CAG CAA GCG CCC AGA 
21177 21186 21195 21204 21213 21222 

WAC CGA CGA GCC GGG CGG CGA CGC GGA CGC GGA CGT GGT GTC GTT CGC GGG TCT 

wL: ___ ^ 

HRRAGR RRGRGRGVVRG S 
TDEPGGDADADVV SFAGL 
PTSRAATRTRTWCRSRV C 

AP PAANGPARRPARASRA 
RRLLQTGPHEVLHALLDR 
DGSSSRE RTSSSTRS CIA 



CAG CGG CCT CCT CGA CGC AAG GGC CCA CGA GCT GCT CCA CGC GCT CGT CTA GCG 
21231 21240 21249 21258 21267 21276 

GTC GCC GGA GGA GCT GCG TTC CCG GGT GCT CGA CGA GGT GCG CGA GCA GAT CGC 



VAGGAAFPGARRGARADR 
SPEELRS RVLDEVREQIA 
RRR S CV P GC STR C A S R S R 
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PSAVRGWPGAREGGAPPA 
LLHSEGGRGQVNAARQHL 
CSIRSAGVARCTRRGSTS 

COT CCT CTA CGC TGA GCG GGG GTG CCG GGA CGT GCA AGC GGC GGG CGA CCA CCT 
21285 21294 21303 21312 21321 21330 

GCA GGA GAT GCG ACT CGC CCC CAC GGC CCT GCA CGT TCG CCG CCC GCT GGT GGA 

A GDATRPHGPARSPPAGG 
QEMRLAPTALHVRRPLVE 
RRCDSPPRPCTFAARWWS 

PARSPS SPPPGGGAPSAG 
LPEVRH HRHHDAAPQLLA 
CPSSETIVTTTRRRSSFR 



CGT CCC CGA GCT GAG CCA CTA CTG CCA 
21339 21348 21357 

GCA GGG GCT CGA CTC GGT GAT GAC GGT 



CCA CCA GGC GGC GGC CGA CCT CTT CGC 
21366 21375 21384 

GGT GGT CCG CCG CCG GCT GGA GAA GCG 



AGARLGDDGGGPPPAGEA 
QGLDSVMTVVVRRRL EKR 
RG STR* *RWWSAAGW RSA 



RGPRAPWCRRSAAWW*RC 
EAPVHRGVDEPLQGGDAV 
R PRSTGALMKQFSGVMLS 

GGA GCC GGC CCT GCA CGG CCG GTT GTA GAA GAC CTT CGA CGG GTG GTA GTC GCT 
21393 21402 21411 21420 21429 21438 

CCT CGG CCG GGA CGT GCC GGC CAA CAT CTT CTG GAA GCT GCC CAC CAT CAG CGA 

P RPGRAGQHLLEAAHHQR 
LGRDVPANIFWKLPT I SD 
SAGTCRPTSSGSCPPSAT 

RRDGSRVG*PVGSP PRGH 
jD D I VQ G F A E R FV R R R V A M 
IMT S * RV S RRVSC G VA S P W 



t?^GTA GCA GCT AGT GGA CTG GCT TGC GGA GTG CCT TGT GGG CTG CCG CCT GCC GGT 
21447 21456 21465 21474 21483 21492 

CAT CGT CGA TCA CCT GAC CGA ACG CCT CAC GGA ACA CCC GAC GGC GGA CGG CCA 




ACG CAG GAC TTG CGT GAC TGA GGC ATT GAG TAC AGT CGT CCC CTG CCG CCC CAC 
21501 21510 21519 21528 21537 21546 

TGC GTC CTG AAC GCA CTG ACT CCG TAA CTC ATG TCA GCA GGG GAC GGC GGG GTG 
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• • L - N' A * T * p-^ L" M- S-'-^'-A^ G ' D G G V 

AS*TH* L RNSCQQGTAG* 
RPERTDSVTHVSRGRRGE 

PGRWGARFGLSFRFFVGT 
LAAGAPGSV*PFGSFCAL 
FPRALRGPFRPF VQFVRW 

TTT CCC GGC GCG GTC GGC CGG GCC TTT GGA TCC CTT TTG GAG TTT TTG TGC GGT 
21555 21564 21573 21582 21591 21600 

AAA GGG GCG GGC GAG CGG GCG CGG AAA CCT AGG GAA AAC CTG AAA AAC ACG CCA 

KGPRQPARKPRENLKNTP 
KGRA SRPGNLGKT*KTRQ 
RAAPAGPET*GKPEKHAS 

R DNN P .P S .MRHW R S N G Q F S 
VITTPRLC EIGDPTGKFR 
YSRQQASVNSAMQLERSV 

CAT GGT AGC AAC AAC CGG CCT CTG TAA GGT ACG GTA GAG CTC AAG GGA ACT TTG 
21609 21618 21627 21636 21645 21654 

^^TA CGA TCG TTG TTG GGC GGA GAC ATT GGA TGC CAT CTG GAG TTC CCT TGA AAC 

^^P^- — • 

VRSL LGGDIRCHLE FP *N 
YDRCWAETFDAIWSSLET 
T IVVGRRHSMPSGVPLKR 

R IQRRQGCPTPYSPA*IP 
GSRVASVALHPIHLREYQ 
VQDSPASRLTH SIFASMN 



CTG GAC TAG ACT GCC GCG ACT GGC GTT 
21663 21672 21681 

GAC CTG ATC TGA CGG CGG TGA CCG CAA 



CCA GAC CCT ATA CTT CCG CGA GTA TAA 
21690 21699 21708 

GGT GTG GGA TAT GAA GGC GCT CAT ATT 




CCA CCC GCC CCA ACC GAG CTC CGA CGC 
21717 21726 21735 

GGT GGG CGG GGT TGG CTC GAG GCT GCG 



CGG GTA ATG GGT ATG GAG CCG GTT TGT 
21744 21753 21762 

GCC GAT TAG GGA TAG CTC GGC CAA ACA 




TGA CCA GGG CCA CCG GTT ATC TTG ACA AGA GAG GAT ACA TGA CCT AAG GTA GTT 
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ACT GGT CCC GGT GGC CAA TAG AAC TOT TCT CTC CTA TGT ACT GGA TTC CAT CAA 



TGPGGQ*NCSLLCTGFHQ 
LVPVANRTVLSYVLDSIK 
WSRWPIELFSPM YWIPSR 

PRFIPPRSQR.RPSR PPSG 
LGSYRLDPNDDPRGRRLD 
SA PIDSTPITTPAVAASI 

CCT CCG GCC TTA TAG CCT CCA GCC CTA ACA GCA GCC CCG CTG GCG CCG CCT CTA 
21825 21834 21843 21852 21861 21870 

GGA GGC CGG AAT ATC GGA GGT CGG GAT TGT CGT CGG GGC GAC CGC GGC GGA GAT 

GGRN IGGRDCRRGDRGGD 
EAGI S EVGIVVGATAAE I 
RPEYRRSGLSSGRPRRRS 

PKRP LRRPTRG PR *RCGA 
L SGH SV ARLEAQVD GV D L 
WAETPSPASNPRS TV*MW 

lllblGT CCG AAG GCA CCC TCT GCC GCG CCT CAA GCC GGA CCT GCA GTG GAT GTA GGT 
21879 21888 21897 21906 21915 21924 

CCA GGC TTC CGT GGG AGA CGG CGC GGA GTT CGG CCT GGA CGT CAC CTA CAT CCA 

PGFRGRRRGVRPGRHLHP 
QA SVGD GAE FG L DVTY I Q 
RLPWE T ARS SAW T S P T S S 

P R .G A R A P R R R A R T G H S G R 
LVGRAPQGVGHEHGTVEE 
CSAGRP SASA. TSTDRSKR 

CGT CCT GCG GGG CGC GCC CGA CCG GCT GCG GCA CGA GCA CAG GGC ACT GAA GGA 
21933 21942 . 21951 21960 21969 21978 

GCA GGA CGC CCC GCG CGG GCT GGC CGA CGC CGT GCT CGT GTC CCG TGA CTT CCT 

^ A GRP AR A GR RRA RV P * L P 
i^P-Q DAP R G L ADAVL V S R D F L 
R* T P -R A G W P- T P - CSC P V - - T S S 

RRRSR* TGPRCSRRPRCR 
AVVVEDHVQAVVVDHVAD 
PSSSKTMYRPSL*TT SP M 

GCC GCT GCT GCT GAA GCA GTA CAT GGA CCC GCT GTT GAT GCA GCA CCT GCC GTA 
21987 21996 22005 22014 22023 22032 

CGG CGA CGA CGA CTT CGT CAT GTA CCT GGG CGA CAA CTA CGT CGT GGA CGG CAT 

RRRRLR HVPGRQLRRGRH 
GDDDFVMYLGDNYVV DG I 
ATTTSSCTWATTTSWTAS 

RSRPPSGGRCARRAP*AR 
DVEHRVEAAVLGGRLDHE 
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GCA OCT GAA GCA CCG CCT GAA GGC GGC GCT GTT CGG GCG GCG CGT CCA GTA CGA 
22041 22050 22059 22068 22077 22086 

CGT CGA CTT CGT GGC GGA CTT CCG CCG CGA CAA GCC GGC CGC GCA GGT CAT GCT 

RRLRGGLPPRQARRAGHA 
VDFVADFRRDKPAAQVML 
STSWRT SAATSPPRRSCS 

GPRRGACTRRPRVQRSRG 
GPDGVRAPEAHGFKVLVA 
AR TASGR LNPTA S S S S F P 

GCG GGC CCA GCG GCT GGG CGC GTC CAA GCC GCA CCG GCT TGA ACT GCT CTT GCC 
22095 22104 22113 22122 22131 22140 

CGC CCG GGT CGC CGA CCC GCG CAG GTT CGG CGT GGC CGA ACT TGA CGA GAA CGG 

RPGRRPAQVRRGRT*RER 
ARVA DPRRFGVAEL DENG 
PGSPTRAGSAWPNLTR TA 

^ . PSRPRP SAGPG WSRGP SR 
y!^; PHGRDHLLGLVGPA VQR D 
^ RTVATTSFGWSGLLS RAI 

GGC CCA CTG GCG CCA GCA CCT CTT CGG GGT CCT GGG GTC CTC GCT GGA CCG CTA 
22149 22158 22167 22176 22185 22194 

CCG GGT GAC CGC GGT CGT GGA GAA GCC CCA GGA CCC CAG GAG CGA CCT GGC GAT 

PGDRGRGEAPGPQERPG D 
RVTAVVEKPQ DPRSDLA I 
G*PRSWRSPRTP GATWRS 

RRTRR* SP RARPRPRC GA 
DAHVGEARGH VLGHGAD P 
T P T Y A K L E A T C S A T A P M R 

( J jGCA GCC GCA CAT GCG GAA GTC GAG CCG GCA CGT GCT CCG GCA CCG GCC GTA GGC 
22203 22212 22221 22230 22239 - 22248 

jRGT CGG CGT GTA CGC CTT CAG CTC GGC CGT GCA CGA GGC CGT GGC CGG CAT CCG 

RRRVRLQLGR A R G R G R H P 
V G V Y A F S SAVHEAVAGI R 
SACTPSAR PCTRPWPASG 

TRASRAPS*RRGATAPRG 
RGPPVLQLDGVG QLPQGV 
GDQRFS SSIVSARCHSAS 

CGG CAG GAC CGC CTT GCT CGA CCT CTA GTG GCT GCG GGA CGT CAC CGA CCG GCT 
22257 22266 22275 22284 22293 22302 

GCC GTC CTG GCG GAA CGA GCT GGA GAT CAC CGA CGC CCT GCA GTG GCT GGC CGA 

AVLAERAGDHRRPAVAGR 
PSWRNE LEITDALQWLAD 
RPGGTSWRSPTPCSGWPT 
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RARPRSWPSRGTS SPRRS 
VPVLDAGRHDVPVPLVDR 
WPCSTPEVTISRYQFSTA 

GGT GCC CGT GCT CCA GCC GAG GTG CCA CTA GCT GGC CAT GAC CTT CCT GCA GCG 
22311 22320 22329 22338 22347 22356 

CCA CGG GCA CGA GGT CGG CTC CAC GGT GAT CGA CCG GTA CTG GAA GGA CGT CGC 

PRARGRLHGDRPVLEGRR 
HGHEVGSTVI DRYWKDVA 
TGTRSAPR*STGTGRTSR 

R*RRGPSSGAGAPTGPSG 
ADGVDQLHVPVQQLGQLG 
LTVSTR SI FRCRS SDR SV, 

CTC GCA GTG GCT GCA GGA CCT CTA CTT GGC CGT GGA CGA CCT CAG GGA CCT CTG 
22365 22374 22383 22392 22401 22410 

GAG CGT CAC CGA CGT CCT GGA GAT GAA CCG GCA CCT GCT GGA GTC CCT GGA GAC 

ERHRRP GDE PAPAGVP GD 
^ SVTDVLEMNRHLLESLET 
Jfl^ ASPTSWR*TGTCWSPW RP 

CRRRPPRPWRVPPGLRPP 
ADVALHVLGAFQ HASDHH 
RM SPST SSALS STP RTTT 

GGC GTA GCT GCC GCT CCA CCT GCT CCG GTC GCT TGA CCA CCC GGC TCA GCA CCA 
22419 22428 22437 22446 22455 22464 

CCG CAT CGA CGG CGA GGT GGA CGA GGC CAG CGA ACT GGT GGG CCG AGT CGT GGT 

P H R R R G G R G Q R T G G P S R G 
RIDGEV DEASELVGRVVV 
ASTARWTRPANW WAESWW 

PPPSS RRSGCR RDRR*R G 
LRPRL D GAGA DDTGGDDA 
SAPAFI EPERMTPGATMP 

CCT CCG CCC CCG CTT CTA GAG GCC GAG GGC GTA GCA GCC AGG GCG GCA GTA GCC 
22473 22482 22491 22500 22509 22518 

GGA GGC GGG GGC GAA GAT CTC CGG CTC CCG CAT CGT CGG TCC CGC CGT CAT CGG 

GGGGEDLRLPH RRSRRHR 
EAGAKI SGSRIVG PAVI G 
RRGRRSPAPASSVPPSSA 

PCP .PAPSRGRDR*RW RPC 
RVRHHLVGVE TGEGGDLA 
GSVTTC SE*RPGKVEMSP 

GGG CCT GTG CCA CCA CGT CCT GAG GAT GGA GCC AGG GAA GTG GAG GTA GCT CCC 
22527 22536 22545 22554 22563 22572 

CCC GGA CAC GGT GGT GCA GGA CTC CTA CCT CGG TCC CTT CAC CTC CAT CGA GGG 
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P ' G W G^'' ^-(r'^''' K "G" ' IT' L p: ' R--^ S^v- H" '** IT' H R G 

PDTVVQDSYLGPFTSI EG* 
RTRWCRTPTSVPSPPSRA 

SGPRACRSGTSSRAAHRK 
VAPDRVALDLVRDHQTAS 
LQRTACLSIWYEI TSRPA 

GTT GAG GGC CCA GCG CGT GTC GCT CTA GGT CAT GAG CTA GCA CGA CGC ACC GCG 
22581 22590 22599 22608 22617 22626 

CAA CTG CCG GGT CGC GCA CAG CGA GAT CCA GTA CTC GAT CGT GGT GCG TGG CGC 

QLPGRAQRDPVLDRAAWR 
NCRVAHSE IQYS I VLRGA 
TAGSRTARSSTRSCCVAL 

SRPLRGHRPSPS RGPS RP 
RDLSDGTDLVRHDAPLGL 
EISPTARTSSETIPRSVS 

AAG CTA GCT CCC TCA GCG GGC ACA GCT CCT GAG CCA CTA GCC GGC CCT CTG GCT 
22635 22644 22653 22662 22671 22680 

^^^TC GAT CGA GGG AGT CGC CCG TGT CGA GGA CTC GGT GAT CGG CCG GGA GAC CGA 

ji^^/r~ 

FDRGSRPCRGLGDRPGDR 
SIEGVARVED SVIGRETE 
RSRESPVSRTR* SAGRPR 

SRRG GST SRAGAPA P L GC 
HVGGGPRRGRVPQHQSVV 
TFAAGRVDVACRSTSPSW 

CCA CTT GCG GCG GGG GGC CTG CAG CTG GCG CGT GGC CGA CCA CGA CCC TCT GGT 
22689 22698 22707 22716 22725 22734 

GGT GAA CGC CGC CCC CCG GAC GTC GAC CGC GCA CCG GCT GGT GCT GGG AGA CCA 



GERRPPDVD RAPAGAGRP 
V NA A P R T S T AHR L VL G D H 
*TPPPGRRPRTGWCWETT 



IW, GPGPRRNFLGASAPSAVT 
A P D L D A T S C A Q P P P P R . S P 
L R TW T P P Q V P R R L R P V R R 

GTC GGC CCA GGT CCA GCC GCC AAC TTG TCC GGA CGC^CTC CGC CCC CTG CGC TGC 
22743 22752 22761 22770 22779 22788 

CAG CCG GGT CCA GGT CGG CGG TTG AAC AGG CCT GCG GAG GCG GGG GAC GCG ACG 

QPG PGRRLNRPAEAGD, AT 
SRVQVGG*TGLR\RRGTRR 
AGS RSAVEQA CGGGGRDG 

FAA*PFMRSPLAPASRP.R 
SPPKRSCALRCRPHPVPV 
HLRSVPVHSVA ARTRFPS 



CAC TTC CGC CGA ATG CCC TTG TAG GCT CTG CCG TCG CGC CCA CGC CTT GCC CCT 
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GTG AAG GCG GCT TAG GGG AAC ATG CGA GAG GGC AGC GCG GGT GCG GAA CGG GGA 



V K A A Y G N ^m) RDGSAGAERG 
*RRLTGTCETAARVRNGD 
EGGLREHARRQRGCGTG'] 

— 

C TRTMPPAPKMPEWYTRJ 
A RGP*R HLPS *RSGTRAR 
PVDQDD TS RAEDAGLVHA 

GGC GTG GAG GAG GAG TAG CCA CCT CGC GCG AAG TAG GCG AGG GTC ATG CAC GCG 
22851 22860 22869 22878 22887 22896 

CGG CAC GTC CTG GTC ATG GGT GGA GCG GGC TTC ATG GGC TCC GAG TAG GTG CGC 

RHV LVI GGAGF I G S QYVR 
GTSWSSVERASSAPSTCA 
ARPGHRWSG LHRLPVRAI 

STRSPSGARTVTSSLSV^ 
VPGPRRDPAPSRAPCA SR 
F QDPVAIRRPHGHQVLQG 

/JUI^TT GAC gag GCG CTG GCG CTA GGC CGC GGC CAC TGG CAC GAC CTG TTC GAG TGG 
22905 22914 22923 22932 22941 22950 

GAA CTG GTC CGG GAC GGC GAT GCG GCG CGG GTG ACC GTG CTG GAC AAG CTG ACC 

E L v' r D G D P AR VT V L D K L T 
N WS GTAIRRG*PCWTS*P 
TGPGRRSGAG DRAGQAD] 

A P F R A F R S G T A P R Y V K T < 
R R S G P S GPAPRRGT CRRA 
VGPVQRVQLRD GAPVGEH 

ATG CGG CCC TTG GAC CGC TTG GAC CTC GGC GAG CGG CGG GGC ATG TGG AAG CAC 
22959 22968 22977 22986 22995 23004 

tag gcg ggg aac ctg gcg aac ctg gag gcg gtc gcg ggc cgg tag acc ttc gtg 

jAy agnlanlep vagrytfv 
wf^^ tpgtwr twsrsp agtp sc 
r r - e p g e -p g a g r r p v h . l r i 

psm qsal ssasttqpwsi 
rrcrrhwaarrpp grgrd 
vavdaigpqeglhdgavi 

gtg ccg ctg tag acg cta cgg tcc gac gag cgg ctc cac cag ggg ccg gtg cta 

23013 23022 23031 23040 23049 23058 

CAC GGC GAC ATG TGC GAT GCG AGG CTG CTC GGC GAG\6TG GTC CCC GGC CAC GAT 

HGD I CDA .RLLAEVVPGHD 
TATSAMPGCSPRWSPATI 
RRHLRCQAARRGGPRPRS 

TTLKAASDCTSRD lASA/ 
P P*SRPRIARRGTSRRRP 
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GAC CAC GAG TTG AAG CGC CGG CTT AGO GTG GAG CTG GCC AGC TAG CGG CTG CGC 
23067 23076 23085 23094 23103 23112 

CTG GTG GTC AAC TTC GCG GCC GAA TCG CAC GTC GAC CGG TCG ATC GCC GAC GCG 

LVVNFAAESHVDRSIADA 
WWSTSRPNRTSTGRSPTR 
GGQLRGRIARRPVDRRRG 

GNMRVLTCPTWASMCTHR 
AT*VYWHAPRGPV*APTG 
RREYTGIHLADLCEHLHA 

CGC GGC AAG TAT GCA TGG TTA CAC GTC CCG CAG GTC CGT GAG TAC GTC CAC ACG 
23121 23130 23139 23148 23157 23166 

GCG CCG TTC ATA CGT ACC AAT GTG CAG GGC GTC CAG GCA CTC ATG CAG GTG TGC 

AP F I RTNVQGVQA LMQVC 
RRSYV PMCRASRHSCRCA 
AVHTYQCAGRPGTHA GVP 

APVALITCTEVSSTYP .L 
'-^^} PPRCPWSRAPRWRRPTRC 
QLGARGPDHLDGGVLHV A 

GAC CTC CGG CCG TGC CGG TCC TAG CAC GTC CAG AGG TGG CTG CTC CAC ATG CCG 
23175 23184 23193 23202 23211 23220 

ctg gag gcc ggc acg gcc agg atc gtg cag gtc tcc acc gac gag gtg tac ggc 

leagtarivqvst'devyg 
w rparpgsc rspptrcta 
ggrhgqdraglhr rgvrq 

m sv p eq s s sag i agl e g * 
crspsrp rprasrgwsar 
adlragpvlvrrdggvrg 

tcg tag ctc tgc ccg agg acc ctg ctc ctg cgc ggc tag cgg ggg ttg agc ggg 
23229 23238 ' 23247 23256 23265 23274 



IHR3C ATC GAG ACG GGC TCC TGG GAC GAG GAC GCG CCG ATC GCC CCC AAC TCG CCG 

SI ET GSWD EDAP I APN S P 
ASRRAPGTRTRRSPPTRP 
HRDGLLGRGRADRPQLAL 

AADLAPPSMTAR A * A R V W 
RPTWPPRRCPRGRRRGCG 
V RRGLRA AVHDGEGVGAG 

ATG CGC CGC AGG TTC CGC CCG CCG CTG TAC CAG CGG GAG CGG ATG CGG GCG TGG 
23283 23292 23301 23310 23319 23328 

TAG GCG GCG TCC AAG GCG GGC GGC GAC ATG GTC GCC CTC GCC TAC GCC CGC ACC 

YAASKAGGDMVALAYART 
TRRPRRAATWSP SPTPAP 
RGVQGGRRHGRPRLRPHP 

-91 - 



P SGTLT VRHPLL * pG* * N 
HAAPSR SATRCC S .RARDT 
MPQRHAHRPAAVVVPG I L 

GTA CCC GAG GGC CAC TCG CAC TGC GCC ACG CCG TTG TTG ATG CCC GGG ATA GTC 
23337 23346 23355 23364 23373 23382 

CAT GGG CTG CCG GTG AGC GTG ACG CGG TGC GGC AAC AAC TAC GGG CCC TAT CAG 

HGLPVSVTRCGNNYGPYQ 
MGCR*A*RGAATTTGPIS 
WAAGERDAVRQQLRAL SV 

GSFTTGSNVVRSSSPWLM 
GPSPRE AT*WGAAP'rgCC 
ERLLDNR.QEGGP QQVAVA 

AAG GGC CTC TTC CAG CAA GGC GAC AAG TGG TGG GCC GAC GAC CTG CCG GTG TCG 
23391 23400 23409 23418 23427 23436 

TTC CCG GAG AAG GTC GTT CCG CTG TTC ACC ACC CGG CTG CTG GAC GGC CAC AGC 

FPEKVVPLFTTRLLDGHS 
^ SR RRSF RCSPPGCWTATA 
P GE GRS AVHHPAAGRP Q H 



GSYPSPPLT RSQTCTDSW 
G ATR PH RCRGPS PARTRG 
DRQV PI AAVDPVPHVHGV 

TAG GGC GAC ATG CCC CTA CCG CCG TTG CAG GCC CTG ACC CAC GTG CAC AGG CTG 
23445 23454 23463 23472 23481 23490 

ATC CCG CTG TAC GGG GAT GGC GGC AAC GTC CGG GAC TGG GTG CAC GTG TCC GAC 

IPL YGD GGNV RDWVHV SD 
SRCTGMAATSGTGCTCPT 
PAVRGWRQRPGLGARVRP 

TRPMRSTASRPSGPCT*W 
jRAPC GA PRRVRAAPAPRG 
^ V HPADPQDGFAPQRPLDV 

ip_ . 

GTG CAC GCC CCG TAG GCC GAC CAG CGG CTT GCG CCC GAC GGC CCC . GTC CAG ATG 
23499 23508 23517 23526 23535 23544 

CAC GTG CGG GGC ATC CGG CTG GTC GCC GAA CGC GGG CTG CCG GGG CAG GTC TAC 

HVRGIRLVAER GL PG QVY 
TCGASGWSPNAGCRG R S T 
RAGHPA GR R T RAAGAGLP 

MAPEAS SVLR -S S V C C S S S 
CR P S P R A S WD P V S A VV A P 
VDRA RGLQGI QFQRLLQQ 

GTG TAG CGC CCG AGC CGG CTC GAC TGG TTA GAC CTT GAC TGC GTT GTT GAC GAC 
23553 23562 23571 23580 23589 23598 

CAC ATC GCG GGC TCG GCC GAG CTG ACC AAT CTG GAA CTG ACG CAA CAA CTG CTG 
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TSRARPS*PIWN*RNNCW 
HRGLGRADQSGTDATTAG 

ARPAP Q SRTSRTGSRFPC 
RGPRRS PGPRAHVRGSPV 
VGQAGAPVPDLTYGVPLS 

CTG CGG GAC CCG CGG CCG ACC CTG GCC CAG CTC GCA CAT GGG CTG GCC TTC OCT 
23607 23616 23625 23634 23643 23652 

GAC GCC CTG GGC GCC GGC TGG GAC CGG GTC GAG CGT GTA CCC GAC CGG AAG GGA 

DA L GA G W D RVER V P D R K G 
TPWAPAGTGSSVYPTGRD 
RPGRRLGPGR ACTRPEGT 

SR*R*ESHSARRPASP* AG 
RG ASSATRRGGRRA RSRV 
VVPAVRQAVGAEAREAVC 

GTG CTG GCC GCG ATG AGC GAC ACG CTG CGG GCG GAG CCG CGC GAG CCG ATG CGT 
23661 23670 23679 23688 23697 23706 

..^CAC GAC CGG CGC TAC TCG CTG TGC GAC GCC CGC CTC GGC GCG CTC GGC TAC GCA 

pprfH DRRYSLCDARLGALGYA 
"^^T T GA T R C A T P OA S A R S A T H 
RPALLAVRRPPRRARLRT 

RTDNSCPRASVTRQYA S F 
GHTTR. ALGRRCRASTRRS 
GTHRELLAEG VGHAPVG.L 

GGG GCA CAC AGC AAG CTC GTT CCG GAG CGG CTG TGG CAC GCG ACC ATG CGG CTC 
23715 23724 23733 23742 23751 23760 

CCC/|CGT GTG TCG TTC GAG CAA GGC CTC GCC GAC ACC GTG dcC TGG TAC GCC GAG 



P -^;'\ VSFEQGLADTVRWYAE 
P ^Y: CRSSK ASPTPCAGTPR 
P ^^ VVRARPRRHRALVRRE 

^(^p^^ RSQHSGNF SRASDSPMAR 
y^yf^ G P S T P A T S R A R A T R R C P E 
V P V P P L R Q V L A R Q G V A H S 

TTG GCC CTG ACC ACC CTC GGC AAC TTG CTC GCG CGC GAC AGG CTG CCG TAC CGA 
23769 23778 23787 23796 23805 23814 

AAC CGG GAC TGG TGG GAG CCG TTG AAC GAG CGC GCG CTG TCC GAC GGC ATG GCT 

NRDWWE PLNERALSDGM A 
T GT GGS R * T SAR C P T AW L 
PGLVGAVERARAVRRHGS 

ATGVAGMVLPSGARP.SGR 
PRASLVWS*PLARGRAEG 
QGHRCCGHSPSLGGA PKG 



GAC CGG CAC GGC TGT CGT GGG TAC TGA TCC CCT CTC GGG CGG GCG CCC GAA GGG 
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CTG GCC GTG CCG ACA GCA CCC ATG ACT AGG GGA GAG CCC GCC CGC GGG CTT CCC 



LAVPTAPMTRGEPARGLP 
WPCRQHP*LGESPPAGFP 
GRADSTHD*GRARPRASP 

RQGFEKNRTTKWIKWSIQ 
ESVSNKTERQKGSKGPSK 
KASRIRQKANNELNELLN 

GAA GCG ACT GGC TTA AGA AAC AAA GCG CAA CAA AAG GTC TAA AAG GTC CTC TAA 
23877 23886 23895 23904 23913 23922 

CTT CGC TGA CCG AAT TCT TTG TTT CGC GTT GTT TTC CAG ATT TTC CAG GAG ATT 

LR *PNSLFRVVFQIFQEI 
FADRILCFALFSRFSRRF 
SLTEFFVSRCFPDFPGDL 

HRVTQH GASGAEDAR MHR 
lAC.QRTVPPAPKMPECTA 
SPAS DP SRR LRS * R SAHP 

^•^r 

^JIgT ACC GCG TGA CAG ACC ACT GGC CGC CTC GGC CGA AGT AGC CGA GCG TAC ACC 
23931 23940 23949 23958 23967 23976 

TGA TGG CGC ACT GTC TGG TGA CCG GCG GAG CCG GCT TCA TCG GCT CGC ATG TGG 

*wrtvw*paepassarm w 
id galsgdr rsrlhrlacg 
(m) ahclvtggagfigshva (3^2. 

lsqeaapvpyrdevveaa 

SARSLRPCRTDTRSSRLP 

ppea*gragpipgrrg * r 
gcc tcc gag acg agt cgg cgc ccg tgg ccc ata gcc agg agc tgc tgg agt cgc 

23985 23994 24003 24012 24021 24030 

CGG AGG CTC TGC TCA GCC GCG GGC ACC GGG TAT CGG TCC TCG ACG ACC TCA GCG 

^-R RLCSAAGTG. YRSS T T SA 
^Pf/^G GSAQPRAPGIGPRRPQR 
. / E A L .L S R G .H R V S V L D D L S G 

AGGLTDGLARVQEGPRHG 

.pvasrtgspXcrnvpdtv 
rcrrahgrpragt*rtps 

cgc cgt ggc ggc . tcg cac agg ggc tcc cgc gcg tgg aca agt ggc cca gcc act 

24039 24048 24057 24066 24075 24084 

* GCG GCA CCG CCG AGC GTG TCC CCG AGG GCG CGC ACQ TGT TCA CCG GGT CGG TGA 

AAPPSVSPRARTCSPGR* 
RHRRAC PRGRA P VHRV GD 
G TAERVPEGAHLFTG SVT 

IHLQ'DVPEEGLL SEVVDE 
STSSTSLS KASCRNSWTK 
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GGC TAG ACC TCG ACC AGO TOT CCG AGA AGC GGC TCG TCG CTA AGO TGG TGC AGA 
24093 24102 24111 24120 24129 24138 

CCG ATG TGG AGC TGG TCG ACA GGC TCT TCG CCG AGC AGC GAT TCG ACC ACG TCT 

PMWSWSTGSSPSSDSTTS 
RCGAGRQALRRAAI RPRL 
DVELVDRLFAEQRFD HVF 

VERRERRLRDTVRHLAEV 
WKAANAASAIL* ETFLRL 
GSRPTRPPPS*DSPSSG* 

AGG TGA AGC GCC GCA AGC GCC GCC TCC GCT AGT CAG TGA GCC ACT TCT CGG AGT 
24147 24156 24165 24174 24183 24192 

TCC ACT TCG CGG CGT TCG CGG CGG AGG CGA TCA GTC ACT CGG TGA AGA GCC TCA 

STSRRSRRRR S VTR *RAS 
PLRGVRGGGDQSLGEEPQ 
HFAAFAAEAISHSVK S LN 

^ V .A G V H H A A H V E D V R R Q S G 
* PVLTI PLTF RMLAASRV 
S RCWRSPCRS G* *RPA AF 

TGA TGC CGT GGT TGC ACT ACC CGT CGC ACT TGG AGT AGT TGC GCC GCG ACG CTT 
24201 24210 24219 24228 24237 24246 

ACT ACG GCA CCA ACG TGA TGG GCA GCG TGA ACC TCA TCA ACG CGG CGC TGC GAA 

TTAPT * WA A*TSSTRRCE 
LRH QRD GQREPHQRGAAN 
YGTN VMGSVNLINAALRT 

ADRE E T ERG GDRHV P VAL 
PTENKQKADETATYPCPS 
RRRTRRNRTRRR PTR A R R 



GGC CGC AGA GCA AGA AGA CAA AGC GCA GGA GGC AGC GCC ACA TGC CCG TGC CGC 
^.^i. 24255 24264 24273 24282 24291 24300 

j(0(tbG GCG TCT CGT TCT TCT GTT TCG CGT CCT CCG TCG CGG TGT ACG GGC ACG GCG 

yj — — _ ___ — 

P A S R S S V S R P P S R C T G T A 
RR LVLL FRVLRRGVRARR 
GVSFFC FASSVAVYGHGE 

GRHPLRRDRYRGVTVAVR 
VGIRSDDIGTGASL*PLA 
SGSAPTTSGPyPRCNRCR 

TCT GGG GCT ACG CCC TCA GCA GCT AGG GCC ATG GCC GGC TGT CAA TGC CGT TGC 
24309 24318 24327 24336 24345 24354 

AGA CCC CGA TGC GGG AGT CGT CGA TCC CGG TAC CGG CCG ACA GTT ACG GCA ACG 

RPRCGSRRSRYRPTVTAT 
DPDAGVVDPGTGRQLRQR 
TPMRESSIPVPADSYGNA 

-95- 



FERDLALQFRRHPGLAQG 
FSVTSRSSSVVIRVWPRG 
SV*PR ARAPFSSASGPGA 

GCT TTG AGT GCC AGC TCG CGC TCG ACC TTT GCT GCT ACG CCT GGG TCC CGG ACG 
24363 24372 24381 . 24390 24399 24408 

CGA AAC TCA CGG TCG AGC GCG AGC TGG AAA CGA CGA TGC GGA CCC AGG GCC TGC 

RNSRS SASWKRRCGPRAC 
ETHGRARAGNDDADPGPA 
KLTVERELETTMRTQGLP 

EGCETHVVHVAF P .LVHAV 
KVANRICLTYPSHCFMRS 
R*RMGYACRTRRIASCAR 

GGA AGT GGC GTA AGG CAT ACG TGT TGC ACA TGC CGC TTA CCG TCT TGT ACG CGC 
24417 24426 24435 24444 24453 24462 

CCT TCA CCG CAT TCC GTA TGC ACA ACG TGT ACG GCG AAT GGC AGA ACA TGC GCG 

'PSPHSVCTTCTANGRTCA 
^^nLHRIPYAQRVRRMAEHAR 
FTA FRM HN VYGEWQ NMRD 

GIAIRDGNEEVLDQAT LR 

g*rlatamkklwirrpsg 
g rdch prwkr*gs .garha 

tgg gga tag cgt tac gcc agc ggt aaa aga agt tgg tct agg acg cgc cac tcg 
24471 24480 24489 24498 24507 24516 

ACC CCT ATC GCA ATG CGG TCG CCA TTT TCT TCA ACC AGA TCC TGC GCG GTG AGC 

TPIAMRSPFSSTRSCAVS 

plsqcgrhflqpdpar*a 
p yrnava i ffnq i l r g e p 

drdvavatlhpreavdlv 
iet*pspp*tran *l*tls 
. )s rprrrrrdpa pt* sr*p 

J^^&h 

r GCT AGA GCC. AGA TGC CGC TGC CGC GAG TCC ACG CCC GCA AGT CGA TGC AGT TCC 
24525 24534 24543 24552 ~ 24561 24570 

CGA TCT CGG TCT ACG GCG ACG GCG GTC AGG TGC GGG CGT TCA GCT ACG TCA AGG 

RSRSTATAVRC GRSATSR 
DLGLRRRRS GAG VQLRQG 
I SVYGDGGQVRAFSYVKD 

D HVD D H AG GLR L L G P A P G 
MTSTMTRAGSVS FAQPRA 
CRPR*RARGRSPSPRPGP 

TGT AGC ACC TGC AGT AGC ACG CGC GGG GGC TCT GCC TCT TCC GGA CCC CGG CCC 
24579 24588 24597 24606 24615 24624 

ACA TCG TGG ACG TCA TCG TGC GCG CCC CCG AGA CGG AGA AGG CCT GGG GCC GGG 
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HRGRHRARPRDGEGLGP G 
IVDVIVRAPETEKAWGR A 

EVDARGAGVGHQLQG LGH 
KLTPEDRVLVTSS SAWAT 
R*RRSTGCWCRAPAPGPR 

GGA AGT TGC AGC CGA GCA GGG CGT GGT TGT GGC ACG ACC TCG ACC GGG TCC GGC 
24633 24642 24651 24660 24669 24678 

CCT TCA ACG TCG GCT CGT CCC GCA CCA ACA CCG TGC TGG AGC TGG CCC AGG CCG 

PSTSARPAPTPCWSWPRP 
LQRRLVPHQHRAGAGPGR 
FN VGSSRTNTVLELAQAV 

T RR G T D GAVGD R V Q GG P V 
RAA APTGLWGMACRGARS 
A H P P R H G W G G W R A G A R G P 

ACG CAC GCC GCC GGC CAC AGG GGT CGG TGG GGT AGC GCG TGG ACG GGC GGG CCC 
24687 24696 24705 24714 24723 24732 

^nTGC GTG CGG CGG CCG GTG TCC CCA GCC ACC CCA TCG CGC ACC TGC CCG CCC GGG 

^P^C VRRP VSPATPSRTCPPG 
ACGGRCPQPP HRAPARPG 
'RAAAGVPSHPIAHLPARD 

lhhdgvg'ggl LGALDEAV 

ST I TA* VAVS SAR S TK P 
RPSP RR CRWRPPGRPRRR 

TGC TCC ACT ACC AGC GGA TGT GGC GGT GGC TCC TCC GGG CGC TCC AGA AGC CGC 
24741 24750 24759 24768 24777 24786 

ACG AGG TGA TGG TCG CCT ACA CCG CCA CCG AGG AGG CCC GCG AGG TCT TCG GCG 

TR*WSPTPPPRRP ARSSA 
RGDGRLHRHRGGP RGLRR 
EVMVAYTATEEAREVFGD 

.^^W/ PRVGRQRVPEG PGGRPGG 

/^i Q A S V G S A. S P S A R V A , A H A A 
S P P C G A P P R A R G S R R T P r' 

TGA CCC GCC TGT GGG GCG ACC GCC TGC CCG AGC GGG CCT GGC GGC GCA CCC GGC 
24795 24804 24813 24822 24831 24840 

ACT GGG CGG ACA CCC CGC TGG CGG ACG GGC TCG CCC GGA CCG CCG CGT GGG CCG 

TGRTPRWRTGSPGPPR GP 
LGGHPAGGRARP DRRVGR 
WADTPLADGLARTAAWAA 

GDAGGFQAGGELDLDASL 
ETPGASSREEKSI SIPPS 
RRRGRRVA SRRR S R S R RL 



GGA GGC AGC CGG GGC GGC TTG ACG CGA GGA GGA AGC TCT AGC TCT AGC CGC CTC 
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24a49'-- 24858^ - . -^2 4^8 6^^^ - 2487^ — - 24885 - ' 24894* 

CCT CCG TCG GCC CCG CCG AAC TGC GCT CCT CCT TCG AGA TCG AGA TCG GCG GAG 




TCG CGC. AGG GCC TCA CCC GCG TCA CAC ACC GGC TGG CCG ACT CGC CGC GGC TGG 
24903 24912 24921 24930 24939 24948 

AGC GCG TCC CGG AGT GGG CGC AGT GTG TGG CCG ACC GGC TGA GCG GCG CCG ACC 

SASRSGRSVWPTG*AAPT 
ARPGVGAVCGRPAERRRP 
RV PEWAQCVADR .L S GADR 

SGWGLGDRKSACRVTSTL 
H D O A W A T E S P L A G S L P P L 
TIGLGLRRAQFRVQCHL Y 

a 

^^JCA CTA GGG GTC GGG TTC GGC AGA GCG AAC CTT CGC GTG GAC TGT CAC CTC CAT 
24957 24966 24975 24984 24993 25002 

GGT GAT CCC CAG CCC AAG CCG TCT CGC TTG GAA GCG CAC CTG ACA GTG GAG GTA 

GDP QPKP.SRLEAHLTVEV 
VIPSPSRLAWKRT*QWR * 
* .SPAQAVSLGSAPDSGGK 

CCH V I K L NPTPY T F E L R P 
AVTFSR SIRRRTRSS SGH 
P L L S R .D Q S E A D P V H V R A T 



TCC GTT GTC ACT TGC TAG AAC TCT AAG 
25011 25020 25029 

AGG CAA CAG TGA ACG ATC TTG AGA TTC 



CCG CAG CCC ATG CAC TTG AGC TCG GCA 
25038 25047 25056 

GGC GTC GGG TAC GTG AAC TCG AGC CGT 




CCC ACT TGC TGA AAC ACA TGT TGC CCC AGG CCA TGC GGT GGC GGA GGT GCG CGC 
25065 25074 25083 25092 25101 25110 

GGG TGA ACG ACT TTG TGT ACA ACG GGG TCC GGT ACG CCA CCG CCT CCA CGC GCG 

G'*TTLCTTGSGTPPPPRA 
• GERLCVQRGPVRHRLHAR 
VNDFVYNGVRYATASTRD 

VQQALRGLLPGVREERRE 
*RSLWGGWSRASANKAAN 
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TGA TGG ACG ACT CGG TCG GCG GGG TCC TCG CCC GGC TGC GCA AGA AGC GCC GCA 
25119 25128 25137 25146 25155 25164 

ACT ACC TGC TGA GCC AGC CGC CCC AGG AGC GGG CCG ACG CGT TCT TCG CGG CGT 



TTC*ASRPRSGPTRSSRR 
LPAEPAAPGAGRRV LRGV 
YLLSQPPQERADAFFAAF' 

RPGLADQLEARQLARVGQ 
GPALRTRSSPASSPASVR 
GPPWARGPARRAPPRPCG 

AGG GCC CCC GGT TCG CGC AGG ACC TCG AGC CGC GCG ACC TCC CGC GCC TGT GGG 
25173 25182 25191 25200 25209 25218 

TCC CGG GGG CCA AGC GCG TCC TGG AGC TCG GCG CGC TGG AGG GCG CGG ACA CCC 

SR GPSA SWSSARWRA RTP 
PGGQARPGARRAGGRGHP 
PGAKRVLEL GALEGAD TL 

,.vRHR S L G AD LDE GQ L AA F L 
AIDPCGPTSIRARSPRSS 
P STPVARRRSGRGPPGRL 

ACC GCT ACA GCC CTG TCG GGC CGC AGC TCT AGG AGC GGG ACC TCC CGG CGC TTC 
25227 25236 25245 25254 25263 ^ 25272 

TGG CGA TGT CGG GAC AGC CCG GCG TCG AGA TCC TCG CCC TGG AGG GCC GCG AAG 

WRCRDSPASRSSPWRAAK 
G DV GTA RRRDPRPGGPRR 
AMS GQP GVE I LAL E GR E E 

V Q A A G L E D H L H V A D G V H F 
FRRRAS N TMSTCPTVLTS 
SGAGRRTR*PPARR*WRP 

TCT TGG ACG CGG CGC GGC TCA AGC ACT ACC TCC ACG TGC CGC AGT GGT TGC ACC 
25281 25290 ' 25299 25308 25317 25326 

*mGA ACC TGC GCC GCG CCG AGT TCG TCA TGG AGG TGC ACG GCG TCA CCA ACG TGG 

RTCAAP SSSW RCTASPTW 
EPA.PRRVRHGGAR RHQRG 
NLRRAE FVMEVHGVTNVE 

EPEGVHLRHLEGPEAVEV 
SRSAST SDISNAPSPWKS 
V GARRR .PTSPTRRARGSR 

TTG AGG CCG AGC GGC TGC ACC TCA GCT ACC TCA AGC GGC CCG AGC CGG TGA AGC 
25335 25344 25353 25362 25371 25380 

AAC TCC GGC TCG CCG ACG TGG AGT CGA TGG AGT TCG CCG GGC TCG GCC ACT TCG 

NSGSPTWSRWSSPGSATS 
TPAR RR GVDGV.RRAR P LR 
LRLADVESMEFAGLGHFD 
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GREACPEEVVHLPGPLQE 
AVSQAPSR*WTCRGQSSS 
RWARRL AGRGRAAARPAA 



TGC GGT GCG AGA CGC GTC CCG AGG AGA TGG TGC ACG TCG CCG GGA CCC TCG ACG 
25389 25398 25407 25416 25425 25434 

ACG CCA CGC TCT GCG CAG GGC TCC TCT ACC ACG TGC AGC GGC CCT GGG AGC TGC 

TPRSA QGSSTTCSGPGSC 
RHAL RRAPL PRAAALGAA 
ATLCAGLLYHVQRPWELL 

GVDAGDGVAEVE GGVVPA 
ASMPETESQR*REVW*QP 
RRCRSRRRSGRGRW GS SP 

AGC GGC TGT AGC CGA GGC AGA GGC TGA CGG AGA TGG AGA GGT GGG TGA TGA CCC 
25443 25452 25461 25470 25479 25488 

TCG CCG ACA TCG GCT CCG TCT CCG ACT GCC TCT ACC TCT CCA CCC ACT ACT GGG 

SPTSAP SPTASTSPPTTG 
. ^ RRHRLRLRLPLPLHPLLG 
AD IGSVSDCLYLSTHYWG 

ARVSHGVEVTR PGGRGRL 
L E S P I V S R S P V R D V G D A F 
CSP RFSRGRRYATWGTRS 

CGT CGA GCC TGC CTT ACT GGC TGG AGC TGC CAT GCG CCA GGT GGG GCA GGC GCT 
25497 25506 25515 25524 25533 25542 

GCA GCT CGG ACG GAA TGA CCG ACC TCG ACG GTA CGC GGT CCA CCC CGT CCG CGA 

AARTE* PTSTVRGPPRPR 
Q LGRNDRPRRYAVHP VRE 
SSDGMTDLDGTRSTPSAK 

GGRAGPGRG*RRRASAPG 
VVGLGL GAAEADVHAPQV 
.^SWGSGWARP RLTS TRQ SS 

aW- .... 

^ TCT GGT GGG GCT CGG GGT CCG GGC GCC GGA GTC GCA GCT GCA CGC GAC CGA CCT 
25551 25560 25569 25578 25587 25596 

AGA CCA CCC CGA GCC CCA GGC CCG CGG CCT CAG CGT CGA CGT GCG CTG GCT GGA 

RPP RAP GPRPQRRRALAG 
DHPEPQAR GLSV DVRWLD 
TTPSPRPAASASTCAGWT 

ATASARGPAPP S *RHRPA 
PRRQHAGQLLRAEGIDLH 
RGDSIRARSCAPKVST ST 



GGC CGG CAG CGA CTA CGC 
25605 25614 
CCG GCC GTC GCT GAT GCG 



GCG GGA CCT CGT CCG CCC 
25623 25632 
CGC CCT GGA GCA GGC GGG 



GAA GTG GCT ACA GCT CCA 
25641 25650 
CTT CAC CGA TGT CGA GGT 
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RPSLMRALEQAGFTDVEV 
GRR*CAPWSRRASPMSRC 

ARAPWPLPRRCRRPRG CP 
QVLPGRCLDAVDD. R GAAL 
SCSRAVASTQSMTAAQRL 

CGA CGT GCT CGC CCG GTG CCG TCT CCA GAC GCT GTA GCA GCG CCG GAG GGC GTT 
25659 25668 25677 25686 25695 25704 

GCT GCA CGA GCG GGC CAC GGC AGA GGT CTG CGA CAT CGT CGC GGC CTG CCG CAA 

AARAGHGRGLRHRRGLPQ 
LHERATA EVCDIVAACRK 
C TSGPRQRSATSS RPAAR 

RRAGSTVSGPRPSLLVCG 
GAHGAR SAARVL RFS SAD 
APTGREHRQGSSAFPPRM 

CCG GCC GCA CGG GGC GAG CAC TGC GAC GGG CCT GCT CCG CTT TCC TCC TGC GTA 
25713 25722 25731 25740 25749 25758 

^GC CGG CGT GCC CCG CTC GTG ACG CTG CCC GGA CGA GGC GAA AGG AGG ACG CAT 

<(^.^GRRAPLV TLPGRGERRTH 
AGVPRS *RCPDEAKGGRI 
PACPAR DAARTRRKEDAS 

HGRR CQVPGRRDLPESPV 
MVVAVS SRAAAI SRNRRS 
WSWPSVPGPRPSRATGV P 

GGT ACT GGT GCC GCT GTG ACC TGG CCC GGC GCC GCT AGC TCG CCA AGG CTG CCC 
25767 25776 25785 25794 25803 25812 

CCA TGA CCA CGG CGA CAC TGG ACC GGG CCG CGG CGA TCG AGC GGT TCC GAC GGG 

P*PRRHWTGPRRS .SGSDG 
ir,,^ DHGDTGPGRGDRAVPTG 
T TATLDRAAAI ERFRRD 

AERVRARNEGRVRDGT EL 
- P K A F A P G T R A G S A I . A R R L 
RSRSRPGPERGPRSRGD* 

TGC CGA AGC GCT TGC GCC CGG GCC AAG AGC GGG GCC TGC GCT AGC GGG CAG AGT 
25821 25830 25839 25848 25857 25866 

ACG GCT TCG CGA ACG CGG GCC CGG TTC TCG CCC CGG ACG CGA TCG CCC GTC TCA 

TA S RTRARFSPRTRSPVS 
RLRERGPGSRPG RDR PSQ 
GFANAGPVLAPDAIARLK 

RAGFPEDGAEGVLAQAGV 
APASRSMVRKVSSPRRES 
PPRRVA**GS*RRPGASR 



TCC GCC CGC GGC TTG CCG AGT AGT GGG CGA AGT GGC TGC TCC CGG ACG CGA GGC 
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2 58-75- ' ^^ ^ 25884^^* ^ ^ 25893 • 259a2-— 2591^ - - - 25920 

AGG CGG GCG CCG AAC GGC TCA TCA CCC GCT TCA CCG ACG AGG GCC TGC GCT CCG 



RRAPNGSSPASPTRACAP 
-GGRRTAHHPLHRRGPALR 
AGAERLITRFTDEGLRSD 

VVPVEGDLAILTGDEVAH 
S*QFKGTSPSSRGTR*RT 
RSSSSG RRPRHADRGRGR 

TGC TGA TGA CCT TGA AGG GGC AGC TCC CGC TAG TCG CAG GGC AGG AGA TGG CGC 
25929 25938 25947 25956 25965 25974 

ACG ACT ACT GGA ACT TCC CCG TCG AGG GCG ATG AGC GTC CCG TCC TCT ACC GCG 

TTTGTSPSRAMSVPSSTA 
RLLELPRRGR*ASRPLPR 
DYWNFPVEGDERPVLYRV 

VVQLL LVPGRFPVQQVAL 
C. LKSFCSQAGSRSRSC RS 
: AC S P S A P S P GPVP G AA GR 

^^flK'CG TGT TGA ACC TCT TCG TCC TGA CCC GGG GCC TTG CCC TGG ACG ACG TGG CGC 
25983 25992 26001 26010 26019 26028 

TGC ACA ACT TGG AGA AGC AGG ACT GGG CCC CGG AAC GGG ACC TGC TGC ACC GCG 

CTTWRSRTGPRNGTCCTA 
AQLGEAGL G PGTGPAAPR 
HNLEKQDWAPER DLLHRE 

F QR L E G GR E HVAR D H G G G 
SSACSAAANTSPG TTGVA 
PVPAARRRT RPRGPRAWR 

TCC TTG ACC GCG TCG AGC GGC GGC GCA AGC ACC TGC CGG GCC AGC ACG GGT GGC 
26037 26046 26055 26064 26073 26082 

AGG AAC TGG CGC AGC TCG CCG CCG CGT TCG TGG ACG GCC CGG TCG TGC CCA CCG 

^R NWRSSPPRSWTARSCPP 
;iflf^ GTGAARRRVR GR PGRAHR 
E L A Q L A A A F V . D G P V V P T A 

VREDELLRV P GRLHWPVT 
*ASTRLSGYRAASTGHCR 
RRARG *PATGPRPPAMAG 

GGA TGC GCG AGC AGG AGT TCC TCG GCA TGG CCC GGC GCC TCC ACG GTA CCG TGG 
26091 26100 26109 26118 26127 26136 

CCT ACG CGC TCG TCC TCA AGG AGC CGT ACC GGG CCG CGG AGG TGC CAT GGC ACC 

PTRSSSRSRTGPRRCHGT 
LRARP QGAVPGRGGAM A P 
YALVLKEPYRAAEVPWHR 

VADVDARARDAIQADAQV 
SRTLTPGRVTQLRLMQRS 
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CAC TGG CGC AGT TGC AGC CGG GCG COT GCC AGA CGT TAG ACT CGT AGA CGG AGO 
26145 26154 26163 26172 26181 26190 

GTG ACC GCG TCA ACG TCG GCC CGC GCA CGG TCT GCA ATC TGA GCA TCT GCC TGG 

VTASTSARARSAI *ASAW 
*PRQRRPAHGLQSEHLPG 
DRVNVGPRTVCNLS I CLD 

VGSRVVSAQLRNRSRVQE 
SAPGCL PHRSATGPDCRS 
RRRVACRIGPPPEPI AGA 

TGC TGC GGC CTG GCG TGT TGC CTA CGG ACC TCC GCC AAG GCC CTA GCG TGG ACG 
26199 26208 26217 26226 26235 26244 

ACG ACG CCG GAC CGC ACA ACG GAT GCC TGG AGG CGG TTC CGG GAT CGC ACC TGC 

TTPDRTTDAWRRFRDRTC 
RRRTAQ RMPGGGSG I APA 
DAGPHNGCLEAVPGSHLL 

GVVGLHRLHARGSGHNRD 
fW' GSSASTAFTRAVPGTTGT 
V^^GRRRRP P S PARSRVR P E P 

AGG GGC TGC TGC GGC TCC ACC GCT TCC ACG CGC GCT GGC CTG GGC ACC AAG GCC 
26253 26262 26271 26280 26289 26298 

TCC CCG ACG ACG CCG AGG TGG CGA AGG TGC GCG CGA CCG GAC CCG TGG TTC CGG 

SPTTPRWRRCARPDPW FR 
PRRRRGGEGARDRTRGSG 
PDDAEVAKVRATGPVVPV 

RDALAVHHHVVDPEDVTR 

GTLWPSTTT CSTRSTWPE 
GP*GPRRPPARRGARGRN 



AGG GCC AGT CGG TCC CGC TGC ACC ACC ACG TGC TGC AGG CCG AGC AGG TGC CAA 
26307 26316 26325 26334 26343 26352 



)^CC CGG TCA GCC AGG GCG ACG TGG TGG TGC ACG ACG TCC GGC TCG TCC ACG GTT 



SRSARA TWWCTT S G S S TV 
P G Q P G R R GGARRPARPRF 
PVSQGDVVVHDVRLVHGS 

ARVGVATPPPGDDD LVGV 
PGFALPLQRRVM TMSYAS 
PGSRWRCNAASWR*RTRR 

GCC CGG GCT TGC GGT TGC CGT CAA CCG CCG CCT GGT AGC AGT AGC TCA TGC GGC 
26361 26370 26379 26388 26397 26406 

CGG GCC CGA ACG CCA ACG GCA GTT GGC GGC GGA CCA TCG TCA TCG AGT ACG CCG 

RARTPTAVGGGPS S S S TP 
GPERQRQLAAD HRHRVRR 
GPNANGSWRRTIVI EYAD 
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RGCRRRGSRQAASRWASM 
GAAGGAGQASRRRAGPLC 
GPRVAPARLAAGGLALCV 

TGG GCC GGC GTG GCG GCC GCG GGA CTC GCG ACG CGG CGG CTC GCG GTC CGT CTG 
26415 26424 26433 26442 26451 26460 

ACC CGG CCG CAC CGC CGG CGC CCT GAG CGC TGC GCC GCC GAG CGC CAG GCA GAC 

TRPHRRRPERCAAERQAD 
PGRTAGALSAAPPSARQT 
PAAPPAP *ALRRRAPGRH 

SRCTL .SDKPHPNHEG GRV 
RVAP*PTK RILI INVAEF 
DFPLD PLRESSS*T*RRS 

TAG CTT GCC GTC CAG TCC CTC AGA AAG CCT ACT CCT AAT ACA AGT GGC GGA GCT 
26469 26478 26487 26496 26505 26514 

ATC GAA CGG CAG GTC AGG GAG TCT TTC GGA TGA GGA TTA TGT TCA CCG CCT CGA 

( I E RQVR E S F G *GL C S P P R 

SNGRSGSLS IL,,^,,^^ EDYVHRLE 
RTAGQGVFR (m) R I M F T A S ^^7^ 



PR SMVHAHHGQGPRQAGR 
QAPC*MHM TGRAQASRAA 
SPPVNCTCPAGPRPAARR- 

TGA CCC GCC CTG TAA TGT ACA CGT ACC ACG GGG ACC GGA CCC GCG ACG CGC GGC 
26523 26532 26541 26550 26559 26568 

ACT GGG CGG GAC ATT ACA TGT GCA TGG TGC CCC TGG CCT GGG CGC TGC GCG CCG 

TGRDITCAWCPWPGRCAP 
LGGTLHVH GAPGLGAAR R 
WAGHYMCMVPL AWALRAA 

SVLDPHRARR RLFAPDGR 
PCSIRTAHGGDCSRPTAA 
^j^P VRS GP P TGATAPVRPRR 

^ . 

GCC CTG TGC TCT AGG CCC ACC GCA CGG GCG GCA GCG TCC TTG CGC CCC AGC GGC 
26577 26586 26595 26604 26613 26622 

CGG GAC ACG AGA TCC GGG TGG CGT GCC CGC CGT CGC. AGG AAC GCG GGG TCG CCG 

RDTRSGWRARRRRNA GSP 
GTRDPGGVPAVAGTR GRR 
GHE IR VACPPS, QERGVAA 

GAQHRDRHEVR -kvHHFA G 
VPRIGTGTS SAGSMISLA 
SRGSAPGPARRAPCSPFR 

GCT GGC CGG ACT ACG GCC AGG GCC ACG AGC TGC GCG GCC TGT ACT ACC TTT CGC 
26631 26640 26649 26658 26667 26676 

CGA CCG GCC TGA TGC CGG TCC CGG TGC TCG ACG CGC CGG ACA TGA TGG AAA GCG 
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R.... p..^.. A' c'^^ .'R^.'.„S--.- R,-,^" C^^^^^ S^-. T— R- R- '*•-• W K A 

DRPDAGPGARRAGHDGKR 
TGLMPVPVLDAPDMMESA 

PQREIHLGHVCRRLGTRP 
RSAN*TCAMYVGGCDPGR 
GAPTRHAPWTCVAATRDA 

GGG CCG ACC GCA AGA TAG ACG TCC GGT ACA TGT GTG GCG GCG TCA GGC CAG GCG 
26685 26694 26703 26712 26721 26730 

CCC GGC TGG CGT TGT ATG TGC AGG CCA TGT ACA CAC CGC CGC AGT CCG GTC CGC 

PGWRSMCRPCTHRRSPVR 
PAGVL .CAGHVHTAAVRSA 
RLAFYVQAMY TPPQSGPR 

R QRQVREGPLRHLREVVE 
GSGSCGNVPCGICDSLSK 
AAAAAGT*RAASATA*RS 

CCG GCG ACG GCG ACG TGG GCA AGT GGC CCG TCG" GCT ACG TCA GCG AGT TGC TGA 
26739 26748 26757 26766 26775 26784 

^^C CGC TGC CGC TGC ACC CGT TCA CCG GGC AGC CGA TGC AGT CGC TCA ACG ACT 

r'GR 'CRCTRSPGSR CSRSTT 
AAAAAPVHRAADAVAQRL 
PLPLHPFT GQPMQSLNDF 

VGAVQAVE PLLRDVRH L A 
SAPSRRSKQFFD I SATC R 

RRRRGARSRSSTSRRPAA 

AGC TGC GGC CGC TGG ACG CGC TGA AGA CCT TCT TCA GCT AGC TGC GCC ACG TCG 
26793 26802 26811 26820 26829 26838 

TCG ACG CCG GCG ACC TGC GCG ACT TCT GGA AGA AGT CGA TCG ACG CGG TGC AGC 

STPATCATSGRSRSTRCS 
R .RRRPARLLEEVDRRGAA 
DAGDLRDFWKKS IDAVQR 

AIVVRHAEAVVPPGVQHH 
L * S L A T L K P S W Q R G S R T T 

CSHCRPSSR RGSAARGPP 

CGT CGA TAC TGT TGC GCC ACT CGA AGC CGC TGG TGA CCG CCG GGC TGG ACC ACC 
26847 26856 26865 26874 26883 26892 

GCA GCT ATG ACA ACG CGG TGA GCT TCG GCG ACC ACT GGC GGC CCG ACC TGG TGG 

AAMTTR*ASATTGGP TWW 
QL *QRGELRRPL AA RPGG 
SYDNAVSFGDHWRPDLVV 

VVDHGDLA CQDGREPAHR 
CSMMATSPASTAASRPTG 
ARC*PRRPRVPRRAGPRA 



ACG TGC TGT AGT ACC GGC AGC TCC CGC GTG ACC AGC GGC GCG AGG CCC CGC ACG 
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2690V 26910 - "- 2691^^" 2692B^ ^ - 26937' ^^ 269^6 

TGC ACG ACA TCA TGG CCG TCG AGG GCG CAC TGG TCG CCG CGC TCC GGG GCG TGC 



CTTSWP SRAHWSPRSGAC 
-ARHHGRRGRTGRRAPGRA 
H 0 ,1 MA V E GA L VAA L R GV P 

ADIHRGPEDAGHL-GLRPE 
LT*TDGPNMPVTSVSGPS 
SRRHTART*RCRPSRAPA 

GCT CGC AGA TAG ACA GCG GGC CCA AGT AGC CGT GGC ACC TCT GGC TCG GCC CCG 
26955 26964 26973 26982 26991 27000 

CGA GCG TCT ATG TGT CGC CCG GGT TCA TCG GCA CCG TGG AGA CCG AGC CGG GGC 

RASMCRPGSSAPWRPSRG 
ERLCVARVHRHRGDRAGA 
SVYVSPGFIGTVETEPGL 

VQDRRVRQ RAELLVADLP 
SR TEAS GSDHKSFYPT S H 
RGPRPPGATTSRSTRRRT 

f \GC TGG ACC AGA GCC GCC TGG GCG ACA GCA CGA AGC TCT TCA TGC CGC AGC TCA 
27009 27018 27027 27036 27045 27054 

TCG ACC TGG TCT CGG CGG ACC CGC TGT CGT GCT TCG AGA AGT ACG GCG TCG AGT 

STWSR RTRCRASRSTASS 
RPGLGGPAVVLRE VRRRV 
DLVSADPLSCFEKYGVE W 

AAVPDLVRHVG*RVHR HR 
PRSRIWYATSGEGSTATG 
PGRGSGTRPPGRVPRPPA 

CCC CGG CGC TGG CCT AGG TCA TGC GCC ACC TGG GGA GTG GCC TGC ACC GCC ACG 
27063 27072 27081 27090 27099 27108 

GGG GCC GCG ACC GGA TCC AGT ACG CGG TGG ACC CCT CAC CGG ACG TGG CGG TGC 

(IhP AATGS STRWTPHRTWRC 
J~ GPRPDPVRGGPLTGRGGA 
G R D R I Q Y A V DPS P D V A - V P 

RQAV RQPQGHAVHGVVAG 
GSPSASRSG MR*TG*LPA 
AAPRRAAAAWASRARCRR 

GCG GCG ACC CGC TGC GCG ACG CCG ACG GGT ACG CGA TGC ACG GGA TGT TGC CGC 
27117 27126 27135^ 27144 27153 27162 

CGC CGC TGG GCG ACG CGC TGC GGC TGC CCA TGC GCT ACG TGC CCT ACA ACG GCG 

RRWATRCGCPCATCPTTA 
AAGRRAAAAHALRALQRR 
PLGDALRLPMRYVPYNGA 

LARVRPLQPRDPASAHAD 
WPASG HCSPGIRPLRTHM 
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G P ' R^^' P^ * & ' T ' Pi " A * P"^ A: G * P c ' '^V -*R ^ T C 

GGG TCC CGC GCC TGG GCA CCG TCG ACC CCG GCT AGG CCC CGT CTG CGC ACA CGT 
27171 27180 27189 27198 27207 27216 

CCC AGG GCG CGG ACC CGT GGC AGC TGG GGC CGA TCC GGG GCA GAC GCG TGT GCA 

PRARTRGSWGRSGADACA 
PGRGPVAAGADPGQTRVH 
QGADPWQLGPIR GRRVCI 

DPAVRGRADEAGVYRRQp 
TQPLEAEPMKPASTGASR 
RRPCSPRPCRRRRRVPAA 

AGC AGA CCC CGT TGA GCC GGA GCC CGT AGA AGC CGC GGC TGC ATG GCC GCG ACG 
27225 27234 27243 27252 27261 27270 

TCG TCT GGG GCA ACT CGG CCT CGG GCA TCT TCG GCG CCG ACG TAC CGG CGC TGC 

SSGAT RPRASS .APTYRRC 
RLGQLGLGHLRRRRTGAA 
VWGNSASGIFGADVPA LR 



VGDVRRHPLAR LHHERRR 
'jr^/CAMSAATRCPASTTSVAG 



ARWRRPPAAPRPPPA* PA 



CCG TGC GGT AGC TGC GCC GCC ACG CCG TCC CGC GCC TCC ACC ACG AGT GCC GCG 
27279 27288 27297 27306 27315 27324 

GGC ACG CCA TCG ACG CGG CGG TGC GGC AGG GCG CGG AGG TGG TGC TCA CGG CGC 

GTPSTRRCGRARR WCSRR 
ARHRRGGAAGRGGGAHGA 
H AIDAAVRQGAEVVLTAP 

LFLHLLQSRQRGADPHQA 
CSCTSSSPASG .APTRTSR 
APVPPPAPLAAPR RGPAA 



GCG TCC TTG TCC ACC TCC TCG ACC CTC GCG ACG GCC GGC CGC AGG CCC ACG ACG 
27333 27342 27351 27360 27369 27378 

>~JGC AGG AAC AGG TGG AGG AGC TGG GAG CGC TGC CGG CCG GCG TCC GGG TGC TGC 



R R N R W R S W E R C R P A S GCC 
AGTGGGAGSAA GRRPGA 'A 
QEQVEELGALPAGVRVLR 

VARQLEDERV AVQQHVVA 
LQGSSSMRGYQSRSTCWP 
CSGAPA* GGTSRGAPAGR 

CGT TGA CGG GCG ACC TCG AGT AGG AGG GCA TGA CGC TGG ACG ACC ACG TGG TGC 
27387 27396 27405 27414 27423 27432 

GCA ACT GCC CGC TGG AGC TCA TCC TCC CGT ACT GCG ACC TGC TGG TGC ACC ACG 

ATARWS SSSRTATCWCTT 
QLPAGAHPPVLRPAGAPR 
NCPLELI LPYCDLLVHHG 
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AGVAVHVADHRPNRLQ 
LALQ*MFPMTAPIGCS] 
CRWSSCSRCRPPSEAAT 



CGT CGC GGT TGA CGA TGT ACT TGC CGT AGC ACC GCC CCT AAG GCG TOG ACA GGG 
27441 27450 27459 27468 27477 27486 

GCA GCG CCA ACT GCT ACA TGA ACG GCA TCG TGG CGG GGA TTC CGC AGC TGT CCC 



AAPTAT *TASWRGFRSCP 
QRQLLHE .RHRGGDSAAVP 
SANCYMNGIVAGIPQLSL 

GEVVVRQDAAATD I GGAG 
ARL*SVSIQPRRISGAPA 
RG*SRCASRRGGYRDRRR 



AGC GGG AGT TGA TGC TGT GCG ACT AGA CGC CGG CGG CAT AGC TAG GGC GGC CGC 
27495 27504 27513 27522 27531 27540 

TCG CCC TCA ACT ACG ACA CGC TGA TCT GCG GCC GCC GTA TCG ATC CCG CCG GCG 



SPSTTTR*SAAAVS IPPA 

DL RPPYRSRRR 
ICGRRIDPAGA 

LG RGLLDLLRQ 
SAVASFTSS A S 
TR GQPWPRSPRPPA 




GGT GGG ACT GGG ACA GGC CGG AAC TCC GGT GCC GGC TCT TCC AGC TCC TCC GCG 
27549 27558 27567 27576 27585 27594 

CCA CCC TGA CCC TGT CCG GCC TTG AGG CCA CGG CCG AGA AGG TCG AGG AGG CGC 



PP*PCPALRPRPRRSRRR 
HPDP 'VRP*G HGREGRGGA 
TLTLSGLEATAEKVEEA] 

APHQEV VAVAPRRLFQP^ 
RRTSNSWR*RRAASFSRS 
./^AGPAT RGGSGGPPP SVA P 

j%- 

ACG CGG CCC ACG ACA AGC TGG TGG CGA TGG CGG CCC GCC GCC TCT TTG- ACG CCC 
27603 27612 27621 27630 '27639 27648 

TGC GCC GGG TGC TGT TCG ACC ACC GCT ACC GCC GGG CGG CGG AGA AAC TGC GGG 



CAGCCSTTATA GRRRNCG 
APGAVRPPLPPGGGETAG 
RRVLFDH RYRRAAEKLRD 

ADLPCRRGGRD GPQQGAE 
PTSRAGEGAATAP S SVRR 
RRRAPVKARRPRRAASGG 



TGC CGC AGC TCG CCC GTG GAA GCG GGC 
27657 27666 27675 

ACG GCG TCG AGC GGG CAC CTT CGC CCG 



GGC GCC AGC GGC CCG ACG ACT GGG CGG 
27684 27693 27702 

CCG CGG TCG CCG GGC TGC TGA CCC GCC 
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RRRAG^T FARRGRRAADPP 
GVERAPSPAAVAGLLTRL 

HRV APQRRLVDGLDHVVG 
TASP PSDAFSTASTTSLA 
RPPRRAT PSPRRRPRPCR 

AGC ACC GCC TGC CGC CCG ACA GCC GOT TCC TGC AGC GGC TCC AGG ACC TGT TGC 
27711 27720 27729 27738 27747 "27756 

TCG TGG CGG AGG GCG GGC TGT CGG CGA AGG AGG TCG CCG AGG TCG TGG ACA ACG 

SWRTAGC RR. RTSPRSWTT 
RGGRRAVGEGRRR GR G QR 
VADGGL SAKDVAEVVDNA 

G LSPPAR SLRAS SPVA P R 
V S A R.L L A H C DP Q L L S L P G 
WRPESSRTVIPSFFPCRA 

GGT GGC TCC GAG CCT CCT CGC GCA CTG TTA GCC CGA CTT CTT CCC TGT CGC CCG 
27765 27774 27783 27792 27801 27810 

^:CA CCG AGG CTC GGA GGA GCG CGT GAC AAT CGG GCT GAA GAA GGG ACA GCG GGC 

P P R L G G A R_ DN RAEEGTAG 
H R G S E E R (v) T I GL K K G Q RArT^^ 
TEARRS A*QSG*RRDSGP ^ 

^ 

R *RPHR S*RSG GTRVA* R 
DDGPTGAEDAGVQAFPE D 
TTVPPAPKMPEWR HSRSM 

GCA GCA GTG GCC CCC ACG GCC GAA GTA GCC GAG GGT GGA CAC GCT TGC CGA GTA 
27819 27828 27837 27846 27855 27864 

CGT CGT CAC CGG GGG TGC CGG CTT CAT CGG CTC CCA CCT GTG CGA ACG GCT^CAT 

RRHRG CRLHRL PPVRTAH 
VVTGG AGFIGSHLCERLI- 
SSPGVPASSAPTCANGSS 

A P D T P S R R P C G T W R C S R S 

L P- T- Q - R- G -A H V V Q G G- A P D R 

S R P R D T V Q t S L R D V P L I A 



GCT CGC CCC AGA CAG CCA CTG GAC GCA CCT GTT GGA CAG GTG GCC GTC CTA GCG 
27873 27882 27891 27900 27909 27918 

CGA GCG GGG TCT GTC GGT GAC CTG CGT GGA CAA CCT GTC CAC CGG CAG GAT CGC 

RAGSVGD LRGQPVHRQDR 
ERGL SV TCVDNL.ST GR I A 
SGVCR*PAWTTCPPAGSR 

GRRARRRPAT*AAAPRRS 
VEVREGVLLPE RQQPGVH 
FRSASASSSRNVSSRAST 

CTT GGA GCT GCG CGA GCG GCT GCT CCT CGC CAA GTG CGA CGA CGC CCG GCT GCA 
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27927"^—- 27936^^- 279'4'5'*-' 27954'^' • 279iS3 " " 27972 

GAA CCT CGA CGC GCT CGC CGA CGA GGA GCG GTT CAC GCT GCT GCG GGC CGA CGT 



EPRRARRR GAVHAAAGRR 
NL DALADEERFTLLRADV 
TSTRSPTRSGSRCCGPT 

RATRRRPAPGGRRGGPT. 
GLREGDLPRDVVDDVQRR 

VSGNET SPGTWWTTWRAD 

CTG GCT COG CAA GAG GCA GCT CCC CGG CCA GGT GGT GCA GCA GGT GGA CCG CAG 
27981 27990 27999 28008 28017 28026 

GAC CGA GCC GTT CTC CGT CGA GGG GCC GGT CCA CCA CGT CGT CCA CCT GGC GTC 

DRA VLRRGAGPPRRPPGV 
TEPFSVEGPVHHVVHLAS 
PSR SPSRGRS TTSSTWR] 

PRGGPSDPAAAPSAAPR; 
RGGGQVIQRQRQLRQP .DA 
GAEGRS*RASGSS VSRTP 

■ mi~~ ~~~ ~~~ "~" -— 

'►^CGG CCG gag GGG GGA CCT GAT AGA CCG CGA CGG CGA CCT CTG CGA CGC CCA GCC 
^' 28035 28044 28053 28062 28071 28080 

GCC GGC CTC CCC CCT GGA CTA TCT GGC GCT GCC GCT GGA GAC GCT GCG GGT CGG 

AGLP .PG L S GAAAGDAA GR 
P A S P L D Y L A L P-L E T L R V G 
RPPPWT I WRCRWRRCG SA 

prsrsraaapppa rrgsr 

RGPGLVRQPQRHRVA GAE 
EAPVSFASRSATACP AR-K 

GAG CCG GCC CTG GCT CTT GCG CGA CGC CGA CCG CCA CCG CGT GCC GCG GGC GAA 
28089 28098 28107 28116 • 28125 28134 

CTC GGC CGG GAC CGA GAA CGC GCT GCG GCT GGC GGT GGC GCA CGG CGC CCG CTT 

(ik-^ GRDRERAAAGGGA RRP L 
'"' S A G T E N A L R L A V A H G A R F 
R P G P R- T R C G W R W R T. A P A S 

PR RWRP SRRPDRRAGATR 
HDGGGRLDVPIGGLVRLG 
TTA EVESI *P SGASCGCD 

GCA CCA GCG GAG GTG GAG CCT CTA GAT GCC CCT AGG GCG GCT CGT GGG CGT CAG 
28143 28152 28161 28170 28179 28188 

CGT GGT CGC CTC CAC CTC GGA GAT CTA CGG GGA TCC CGC CGA GCA CCC GCA GTC 

RGRLHLGD LRGSRRAPAV 
VVASTSEIYGDPAEHPQS 
WSPPPRRSTGIPPSTRSP 

SSSPCR*GSRGANPTRR P 
LAVPAVDVRDARTRHVVL 

• no- 



GCT CTC GAT GAG CCC GTT GCA GTT GGG CTA GCC GGG CGC AAG CCA CAT GCT GCT 
28197 28206 28215 28224 28233 28242 

CGA GAG CTA CTG GGG CAA CGT CAA CCC GAT CGG CCC GCG TTC GGT GTA CGA CGA 

RELLGQRQPDRPAFGVRR 
ESYWGNVNPIGPRSVYDE 
RATGATSTRSARVRCTTR 

WVT *RPASRRRRACAPRP 
GFPEGLRQGGGVRARQAR 
ALRNVSASVAA*ARVSPA 

CCG GTT TGC CAA GTG GCT CCG CGA CTG GCG GCG GAT GCG CGC GTG CGA CCC GCG 
28251 28260 28269 28278 28287 28296 

GGC CAA ACG GTT CAC CGA GGC GCT GAC CGC CGC CTA CGC GCG CAC GCT GGG CGC 

G QTVHRGADRRLRAHA GR 
AKRFTE ALTAAYARTL GA 
PNGSPRR *PP PTR ARWAR 

^ CRCQG GT*SRRVASAGRR 
■i" VGA N GA QE VGV S R P H AAV 
•SVP MARRNLE*PGRIRRS 

CCT GTG GCC GTA ACG GGC GGA CAA GTT GAG GAT GCC TGG CGC CTA CGC GGC GCT 
28305 28314 28323 28332 28341 28350 

GGA CAC CGG CAT TGC CCG CCT GTT CAA CTC CTA CGG ACC GCG GAT GCG CCG CGA 

GHRHCPPVQLLRTADAP R 
DTGIARLFNSYGPR MRRD 
TPALPACSTP TDRGCAAT 

R A P P A S R * R G P A R .R V A A * 
VPPHHRGED VLREGSQR E 
SPRTTGVKMSWASAPSG S 

GCT GCC CGC CCA CCA CGG CTG GAA GTA GCT GGT CCG CGA GCG GCC TGA CGG CGA 
28359 28368 28377 28386 28395 28404 

WcGA CGG GCG GGT GGT GCC GAC CTT CAT CGA CCA GGC GCT CGC CGG ACT GCC GCT 

R R A G G A D L H R P G A R R T A A 
DGRVVPTFIDQ ALAGLPL 
TGGWCRPSSTRRSPD CRS 

W*RCRRGSGTATSRRPC P 
GDVAAAGLGPRQAVDLVR 
VMLPLPAWVRDSH*TSSV 

GTG GTA GTT GCC GTC GCC GCG GGT CTG GGC CAG CGA CAC GAT GCA GCT CCT GTG 
28413 28422 28431 28440 28449 28458 

CAC CAT CAA CGG CAG CGG CGC CCA GAC CCG GTC GCT GTG CTA CGT CGA GGA CAC 



HHQRQRRPDPVAVLRRGH 
TINGSGAQTRSLCYVEDT 
PSTAAAPRPGRCATSRTR 



APVSPGSPSTRGPGP*C] 
HPSQHGQHVRGERARDVD 
TRPSIARISEDKGPGTLM 



CCA CGC CCC TGA CTA CCG GGA CTA CCT GAG CAG GAA GGG CCC GGG CCA GTT GTA 
28467 28476 28485 28494 28503 28512 

GGT GCG GGG ACT GAT GGC CCT GAT GGA CTC GTC CTT CCC GGG CCC GGT CAA CAT 

GAGTDGPDGLVLPGPGQH 

VRGLMALMDSSFPGPVNI 
'C .GD*WP *WTRPSRARST i 

RSRHS SRGDSRPPSRRVl 
ARGTLH GDTLDRLRDGCE 
PAVPSIVTR*IASAIAAS 



GCC GCG CTG GCC ACT CTA CTG GCA GGC 
28521 28530 28539 

CGG CGC GAC CGG TGA GAT GAC CGT CCG 



AGT CTA GCG CCT CCG CTA GCG GCG TGA 
28548 28557 28566 

TCA GAT CGC GGA GGC GAT CGC CGC ACT 




GCG CCC TCA CCT CGA CGC CTG GCT CAA GGC GCG CGG CCG CCT CCT GCT CGG GCC 
28575 28584 28593 28602 28611 28620 

CGC GGG AGT GGA GCT GCG GAC CGA GTT CCG CGC GCC GGC GGA GGA CGA GCC CGG 

RGSGAADRVP RAGGGRAR 
AGVELRTEFRAPAEDEPG 
RE WSCGPSSARRRRT S P i 

ASGRCRSRWSSAPSSAR] 
PAA GVD L GG PRL Q AP L G L 
^R RQGSMSVALVFSPQFGS 

'Smt^- - — — — — — — — — — — — — . 



GGC CGC GAC GGG GCT GTA GCT CTG GCG GTC CTG CTT CGA CCC GAC CTT. CGG GCT 
.28629 28638 28647 28656 28665 28674 

CCG GCG CTG CCC CGA CAT CGA GAC CGC CAG GAC GAA GCT GGG CTG GAA GCC CGA 

PA LPRHRDRQDEAGLEAR 
RRCPDI ETARTKLGWKPE 
GAAPTSRPPGRSWAGSPI 

AARRLA *ACGA R T PS CR C 
HR EGFPELAGQEPPLAGV 
TGSASP SLRVRSQHSLV* 



CCA CGG CGA GCG GCT TCC CGA GTT CGC 
28683 28692 28701 

GGT GCC GCT CGC CGA AGG GCT CAA GCG 



GTG GGA CGA GAC CAC CCT CTC GTG GAT 
28710 28719 28728 

CAC CCT GCT CTG GTG GGA GAG CAC CTA 
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VPLAEGLKRTLLWWESTY 
CRSPKGSSAPCSGGRAPT 

APCPGRRRSRNSRC*SHL 
RPVHGVVAHVTRAV DPTS 
GRSMA WSPTFPELSMLLP 

GGG CGC CCT GTA CCG GGT GCT GCC GCA CTT GCC AAG CTC GCT GTA GTC CTC ACC 
28737 28746 28755 28764 28773 28782 

CCC GCG GGA CAT GGC CCA CGA CGG CGT GAA CGG TTC GAG CGA CAT CAG GAG TGG 

PAGHGPRRRERFERHQEW 
PRDMAHDGVNGSSDIRSG 
RGTWPTTA*TVRATSGVE 

PMVLWVGAP LPTRIGRLT 
RCSLGSVPR CPPASAGSR 
AAHCALCRGALPHPHGPA 

TCG CCG TAC TGT TCG GTC TGT GGC CGG CCG TTC CCC CAC GCC TAC GGG GCC TCG 
28791 28800 28809 28818 28827 28836 

.-AGC GGC ATG ACA AGC CAG ACA CCG GCC GGC AAG GGG GTG CGG ATG CCC CGG AGC 



r S G ^ T S Q T P A GKGVRMPR S (y^ 

AA*QARHRPARGCGCPG A 

RHDKPDTGRQGGADAPER 
^ 

SSSLT TQSHSSGSPMCTR 
RPV*RPRP.TPRGRPCAPA 
DLFEVHDPLPV VGLAHLH 

CAG CTC CTT GAG TTG CAC CAG ACC CTC ACC CTG CTG GGG CTC CCG TAC GTC CAC 
28845 28854 28863 28872 28881 28890 

GTC GAG GAA CTC AAC GTG GTC TGG GAG TGG GAC GAC CCC GAG GGC ATG CAG GTG 

VEELNVV .WEWDDPEGMQV 
SRNStW SGSGTTPRACRC 
RGTQRGLG VGRPRGHAGA 



P E R A I L G T V L I Q A V T G L P 



^:^S A P * .* G R S S Y R R S R A S R I 
A R P S D A G H R T D A R G H R A S 



GCC GAG CGC CCG ATA GTC GGG GCA CTG CTC ATA GAC GCG CTG GCA CGG CTC GCC 
28899 28908 28917 28926 28935 28944 

CGG CTC GCG GGC TAT CAG CCC CGT GAC GAG TAT CTG CGC GAC CGT GCC GAG CGG 

RL.AGYQPRDEYLRDRAER 
GSRAI SPVTSICATVPSG 
ARGLSAP*RVS ARPCRAD 

SWNAAASDRVGSVSRNS I 
RGTPRPATGSGPCRDTRS 
DVLQGRRQG QGRVGI QEL 



TAG CTG GTC AAC CGG CGC CGC GAC AGG GAC TGG GGC CTG TGG CTA GAC AAG CTC 



289 53: .: ^ 28aS2^ - ^209^1""'"^^ -2898^^^-^ 2a989-^ -i 28998 

ATC GAC CAG TTG GCC GCG GCG CTG TCC CTG AGO CCG GAG ACC GAT CTG TTC GAG 



IDQLAAALSLTPDTDLFE 
.S TSWPRRCP*PRTP I C SR 
RPVGRGAVPDPGHRSVRD 

PLPSPTMARSSAGRTPLR 
RCRRPR*PGRAPAGPRCG 
DAAALA.DHGALQRGPDAA 

TAG CCG TCG CCG CTG CCG CAG TAG CGG GCG CTG GAC CGC GGG GCC CAG CCG TCG 
29007 29016 29025 29034 29043 29052 

ATC GGC AGC GGC GAG GGC GTC ATG GCC CGC GAG CTG GCG CCC CGG GTC GGC AGC 

IGSGEGVMAREL APRVGS 
SAAARASWPASW RPGSAA 
RQRRG RHGPRAGAPGRQP 

SHASTLRDNRSFVRAVQA 
ATRPR * GTTGP S S GR WRH 
QQARVDAQREQLLGAGGT 

ifl^AC GAC ACG CGC CTG CAG TCG GAC AGC AAG GAC CTC TTC TGG GCG CGG TGG ACA 

.\'~" 29061 29070 29079 29088 29097 29106 

CTG CTG TGC GCG GAC GTC AGC CTG TCG TTC CTG GAG AAG ACC CGC GCC ACC TGT 

LLCADVSLSFLEKTRATC 
CCARTSACRSWRRPAPPV 
AVRGRQPVVPGEDPRHLC 

PRGLTV*WWMRFS*RAPS 
PAAWR*RGGCGSRSG PRV 
RPPGVDGVVVDPVV VQG S 

CGC CCC GCC GGG TTG CAG TGG ATG GTG GTG TAG GCC TTG CTG ATG GAC CGG CCT 
29115 29124 29133 29142 29151 29160 

GCG GGG CGG CCC AAC GTC ACC TAG CAC GAG ATC CGG AAC GAC TAG CTG GCC GGA 

^ A GRPNVT YHHIRNDY L AG 
J||^> RGGPTSPTTTSGTTTWPD 
G A A- Q R H L P P . H PER L P G R T 

GSAE KSAPNASLTKMWR .F 
EPR RRRRRIRA*R R*GGS 
K RVG G E VGSERE VDE D VQ 

GAA GGC CTG CGG AGG AAG CTG CGG CCT AAG CGC GAG TTG CAG AAG TAG GTG GAC 
29169 29178 29187 29196 29205 29214 

CTT CCG GAC GCC TCC TTC GAC GCC GGA TTC GCG CTC AAC GTC TTC ATC CAC CTG 

LPDASFDAGFALNVFI HL 
FRTPPSTPDSRSTSSST* 
SGRLLRRRIRAQRLHPPE 

AKST*R*RRSIRRTSRGP 
RRRPRGRGARSGA PAAAR 



TTG CGG AAG CTC GAG ATG GAG ATG GAG GCG CTC TAG GCC GCC CAC GAG GCC GGG 
29223 29232 29241 29250 29259 29268 

AAC GCC TTC GAG GTC TAG CTC TAG CTG CGC GAG ATG CGG CGG GTG CTG CGG CCC 



NAFEVYLYLREIRRVLRP 
TPSRSTSTCARSGGCCGP 
RLRGLPL PARDPAGAAAR 

P RN RK.L * R S KP S T V .L GC N 
RGTGR*SGPSRRP*WAAT 
AAPEEEVVQVEALDGPRL 

CCG CGG GCC AAG GAG AAG TTG ATG GAG CTG AAG CCG CTC GAG TGG TCC GGG GTC 
29277 29286 29295 29304 29313 29322 

GGG GGC CGG TTC CTC TTC AAC TAG CTG GAC TTC GGG GAG GTC ACC AGG CCG CAG 

GGRFL FNYLDFGEVTRPQ 
AAGSSSTTW-TSARSPGRS 
RPVPLQLPGLRRGHQA AV 

^ WS YTLL*GPACGTATLPN 
^1^' GRT R * S S GRPAGP RR * P I 
r E VL VD L AV GPRVR D G D L S 

AAG GTG CTC ATG CAG TTC TGG ATG GGG CCC CGC GTG GGC CAG CGG CAG TTC CCT 
29331 29340 29349 29358 29367 29376 

TTC CAC GAG TAG GTC AAG AGC TAG CCC GGG GCG CAC CCG GTC GCC GTC AAG GGA 

F HEYVKSYPGAH PVAVKG 
STSTSRATPGRTRSPSRD 
PRVRQELPRGAPGRRQGI 

MDQSPVSTTRLSAASAPS 
*TRARC RRPGCARPPPRA 
E H G P E A G V H D A.L E R R L G P 

AAG TAG AGG ACC GAG CCG TGG CTG CAC CAG GCG TTC GAG CGC CGC CTC CGG CCC 
^ 29385 29394 29403 29412 29421 29430 

IprTC ATG TCC TGG CTC GGC ACC GAC GTG GTC CGC AAG CTC GCG GCG GAG GCC GGG 

F ' M S W L G T D V V R K L A A E . A G 
SCPGSAPTWSASSRRRPG 
HVLARHRRGP QARG,GGRA 

VGTGPDCSSWPPTQK RVR 
SVPVRTARRGPRRRSG*G 
QCR YGPRVVVLAADAEEG 

GAG TGT GGC CAT GGG CCC AGC GTG CTG CTG GTC CCG CCG CAG ACG AAG GAG TGG 
29439 29448 29457 29466 29475 29484 

CTG ACA CCG GTA CCC GGG TCG CAC GAC GAC CAG GGC GGC GTC TGC TTC CTC ACC 

LTPVPGSHDDQGGV CFLT 
*HRYPGRTTTRAASASSP 
D TG TRV ARRPGRR L L PH P 
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RLSCSAAHPVARQSPLAG 
AC PVPPQ TLYRVSPRCPG 
QA PFLLSRSTGCA PVALG 

GAG GCG TCC CTT GTC CTC CGA CGC ACT CCA TGG CGT GCG ACC CTG CCG TTC CGG 
29493 29502 29511 29520 29529 29538 

CTG CGC AGG GAA CAG GAG GCT GCG TGA GGT ACC GCA CGC TGG GAC GGC AAG GCC 

LRREQEA A*GTARWDGKA 
C A G N R R L EVPHAGTARP 
A Q G T G G C © RYRTLGRQGP 



LDGGDAQAGPRQAPEPAA 
STEET QRPVQASLPNQPL 
R PRRRRGPCRPASRT .RPC 

GGC TCC AGA GGA GGC AGA CGG ACC CGT GGA CCC GCG ACT CGC CCA AGA CCC CGT 
29547 29556 29565 29574 29583 29592 

CCG AGG TCT CCT CCG TCT GCC TGG GCA CCT GGG CGC TGA GCG GGT TCT GGG GCA 

PRSPPSAWAPGR*AGSGA 
RGLLRLPGHLGAE R V L G Q 
t|[|| EV .SSVCLGTWALSG FWGS 

PGL RGDLRDPAREVQADV 
RVSG AT SATRRAN SRP T L 
GSRAPRRPPGARTRGPR* 

CGG CCT GGC TCG GCC GGC AGC TCC GCC AGG CCG CGC GCA AGC TGG ACC CGC AGT 
29601 29610 29619 29628 29637 29646 

GCC GGA CCG AGC CGG CCG TCG AGG CGG TCC GGC GCG CGT TCG ACC TGG; GCG TCA 

AGPSRP SRRSGARS TW AS 
PDR AGRRGGPAR VRP G RQ 
RTEPAVEAVRRAFDL 'GVN 

EEVGRVGVARAHGL R S Q G 

KKSVA CA*PAPMASAP SA 

^^^S R RCRARRRRPCPRPPVP 
JP 

TGA AGA AGC TGT GGC GCG TGC GGA TGC CGC GCC CGT ACC GGC TCC GCC CTG ACC 
29655 29664 29673 29682 29691 29700 

ACT TCT TCG ACA CCG CGC ACG CCT ACG GCG CGG GCA TGG CCG AGG CGG GAC TGG 

TSSTPRTPTARAWPR RDW 
LLRHRARLRRGHGRGGTG 
FFDTAHAYGAGMAEAGLA 

AAQAVQQAGTA GVDDDRR 
RPRPSRSRVRRESMTM EV 
GRGPRGAACGDSRCR*RS 

GGG CGC CGG ACC CGC TGG ACG ACG CGT GGG CAG CGA GGC TGT AGC AGT AGA GCT 
29709 29718 29727 29736 29745 29754 

CCC GCG GCC TGG GCG ACC TGC TGC GCA CCC GTC GCT CCG ACA TCG TCA TCT CGA 
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PRPGRPAAHPSLRHRHLD 
RGLGDLLRTRRSDIV I ST 

.L AAQLQPAVTHDAVAVGT 

FPPRSSRPSPTTRLLSAP 
SPRGPAAPRRHP .GCCRRR 

GOT TCC CGC CGG ACC TCG ACG CCC CGC TGC CAC ACC AGG CGT TGT CGC TGC GGC 
29763 29772 29781 29790 29799 29808 

CGA AGG GCG GCC TGG AGO TGC GGG GCG ACG GTG TGG TCC GCA ACA GCG ACG CCG 

RRAAW S C GATVW S A T A T P 
EGRPGAAGRRCGPQQRRR 
KGGLELRGDGVVRNSDAG 

EQAGVQGVAQARQPGVVH 
KRRALRVSLRRE SPVS*T 
NGARWGSRCGASAPSRSR 

CAA AGG ACG CGC GGT TGG ACT GGC TGT CGG ACG CGA GCG ACC CCT GGC TGA TGC 

29817 29826 29835 29844 29853 29862 

^G TT TCC TGC GCG CCA ACC TGA CCG ACA GCC TGC GCT CGC TGG GGA CCG ACT ACG 

, 

t'VSCAPT *PTACARWGPTT. 
FPARQPDRQPALAGDRLR 
FLRANLTDS LRS.LGTDYV 

VHEQDVPGVRPDRRGLRR 
STNRTWQGSGLTGGASV A 
PRTGPGSARGSPGAPRSP 

ACC TGC ACA AGG ACC AGG TGA CCG GGC TGG GCT CCC AGG GCG GCC GGC TCT GCC 
29871 29880 29889 29898 29907 29916 

TGG ACG TGT TCC TGG TCC ACT GGC CCG ACC CGA GGG TCC CGC CGG CCG AGA CGG 

WTCSWSTGPTRGSRRPRR 
GRV P G P LARP E G P A G R D G 
DVFLVHW PDP RVPPAETA 

ijf^^ TRQRPEHLFPEGPVH ADG 
PASAPNTSSPSARY T P T E 
P H A P P T R P P L A R G T R P R R 

GCC CAC GCG ACC GCC CCA AGC ACC TCC TTC CCG AGC GGG CCA TGC ACC CGC AGA 
29925 29934 29943 29952 29961 29970 

CGG GTG CGC TGG CGG GGT TCG TGG AGG AAG GGC TCG CCC GGT ACG TGG GCG TCT 

RVRWR G SWRKGS P GTWAS- 
GCAGG VRGGRAR PVRGRL 
GALAGFVEEGL ARYVGVS 

VE GDLFH GFEGGDDGRLD 
LKVTSS lASNEETTVGCT 
WS*RRPFPRIRRRR*GAP 



GGT TGA AGT GGC AGC TCC TTT ACC GGC TTA AGA GGA GGC AGC AGT GGG GCG TCC 



29979. .. 299B©:: :29a97*- ^: 30a06 ; * 3001i:5^ ^ 30024 

CCA ACT TCA CCG TCG AGG AAA TGG CCG AAT TCT CCT CCG TCG TCA CCC CGC AGG 



PT SPSRKW PNSPPS SPRR 
.QLHRRGNGRILLRRHPAG 
NFTVEEMAEFSSVVTPQV 

GLHRE VHEVAADLLLHQR 
AWTGNLMSSRPMSFCT SG 
RGPAT* CARG RCRSAPAA 

AGC GGG TCG ACG GCA AGT TGT ACQ AGG TGG CGC GGT AGG TCT TCG TCC ACG ACG 
30033 30042 30051 30060 30069 30078 

TCG CCC AGG TGC CGT TCA ACA TGC TCG ACC GCG GCA TCG AGA AGC AGG TGC TGC 

SPRCRSTCS TAASRSRCC 
RPGA VQHARPRHREAGAA 
AQVPFNMLDRGIEKQVLP 

VA.G' S GPDADHPPRRERVP 
C Q A A A P I P T M P H D A S A C P 
- A'SRRQRSRR*PTTPARAR 

t^j^CG TGA CGC GGC GAG GGC CCT AGC CGC AGT ACC CCA CCA GCC GCG AGC GCG TGC 
iP^ 30087 30096 30105 30114 30123 30132 

' ' CGC ACT GCG CCG GTG CCG GGA TGG GGG TGA TGG GGT GGT GGG CGC TGG CGC ACG 

R T A P L P G SASWGGR RSRT 
ALRRCR D RRHGVVGARAR 
HiCAAAGIGVMG WSALAHG 



H QRSRETGALHERGVVPA 
TSAPASRGPWTNGGSSQR 
PAPPLAGDRGPTG ARR SA 



GGG AGG AGC GCC GTG GGG AGG GAG GGG GGG TCC ACA AGG GGG GGG TGG TGA CCG 
•,30141 30150 30159 30168 30177 30186 

GGG TGC TGG GGG GAG GGC TGC GTG CCG GGG AGG TGT TGG GGC CCG ACG ACT GGC 




GVGRGELAFAEGLQERGH 
A*EGVKWPSRKALSSAAT 
RRS GSRGPRVSRWAARPR 



CGC GGA TGA GGG GGT GGA AGG TCG CGC TTG GGA AGG GGT TCG AGG AGC GCC GGC 
30195 30204 30213 30222 30231 30240 

GCG CGT AGT GGC GGA CCT TGC AGG GGG AAG GGT TCG GGA AGG TGG TGG GGG CCG 

AP TP RP S^RANAS P S C S RP 
RL LPDLPGRTLRQAARGR 
AYS PTFQGERFAKLLAAV 

VPQLLEGGFAPVTDGLER 
SRSFSNAASRPGLTAWSA 
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ACC TOG CCG ACT TCC TCA AGC GGC GGC TTG CGC CCG TGT CAC AGC GGG TCG AGC 
30249 30258 30267 30276 30285 30294 

TGG ACC GGC TGA AGG AGT TCG CCG CCG AAC GCG GGC ACA GTG TCG CCC AGC TCG 

WTG*RSSPPNAGTVSPSS 
GPAEGVRR RTRAQCRPAR 
DRLKEFAAERGHSVAQLA 

KGPHQGVGRSDDRDDAGL 
SAQTSAWGEPTMGTMPAW 
AQRPAPGGRPL*GP * RR G 

GCG AAC GGA CCC ACG ACC GGG TGG GGA GCC CTC AGT AGG GCC AGT AGC CGC GGG 
30303 30312 30321 30330 30339 30348 

CGC TTG CCT GGG TGC TGG CCC ACC CCT CGG GAG TCA TCC CGG TCA TCG GCG CCC 

RLPGCWPTPRESSRSSA P 
ACLGAGPPLGSHPGHRRP 
LAWVLAHPSGVI PVIGAQ 

K. GL V Q L VAD P G H V E V E V L 
SGSCRS SLTRATSRSR S S 
^^'A ERA.GPPCRGPRPGRGRR 

TCG AAG GGC TCG TGG ACC TCC TGT CGC AGG CCC GGC ACC TGG AGC TGG AGC TGC 
30357 30366 30375 30384 30393 30402 

AGC TTC CCG AGC ACC TGG AGG ACA GCG TCC GGG CCG TGG ACC TCG ACC TCG ACG 

S F P S T W R T A S G P W T S T S T 
ASRAPGGQRPGR GPRPRR 
LPEHLEDSVRAVDLDLDE 

GLQAGQVFQQGVRGLQVA 
ASSRARSSSSASAGS S S P 
PRAARGPRV APRRARAPR 

TCC GGC TCG ACG CGC GGG ACC TGC TTG ACG ACC GGC TGC GCG GGC TCG ACC TGC 
30411 30420 30429 30438 30447 30456 

.(mfpG CCG AGC TGC GCG CCC TGG ACG AAC TGC TGG CCG ACG CGC CCG AGC TGG ACG 

R P S C A P W T N C W P T R P S W T 
GRAARPGRTAGRRARAGR 
AELRALDELLA DAPELDG 




APVLRGRAFLPRDSTAVS 
LPSWGGARSSLDT Q PPWP 
CRPGVARARLSTPRLHGR 



CGT CGC CCC TGG TTG GCG GGC GCG CGC TTC TCT CCA GCC AGA CTC CAC CGG TGC 
30465 30474 30483 30492 30501 30510 

GCA GCG GGG ACC AAC CGC CCG CGC GCG AAG AGA GGT CGG TCT GAG GTG GCC ACG 



AAGTNRPR AKRGRSEVA T 
QRGPTARARREVGLRWPR 
SGDQPPAREERSV*GGHG 

.119- 



I G T GWSLSQYSWNVT S I M 
SARGGA*RSTRGTSRRS* 
LHGDGLEVVPVVLQGDLD 

CTC TAG GGG CAG GGG GTC GAG TTG CTG ACC ATG CTG GTC AAC TGG GAG CTC TAG 
30519 30528 30537 30546 30555 30564 

GAG ATG CCC GTC CCC CAG CTC AAC GAC TGG TAG GAC CAG TTG ACC GTC GAG ATC 



S (m) PVPQLNDWYDQLTVEI /^J^ 

R ^c pspssttgtts*psrs C2r(^ 



E 

DARPPAQRLVRPVDRRDH 



SRTQAGSEPQRSMPAPPP 
RVPRRGRSRSGPCR HRRR 
DFPDAGGVGAAQVDTGAA 

TAG CTT GCC CAG ACG CGG GGG CTG AGG CCG ACG GAC CTG TAG CCA CGG CCG CCG 
30573 30582 30591 30600 30609 30618 

ATC GAA CGG GTC TGC GCC CCC GAC TCC GGC TGC CTG GAC ATC GGT GCC GGC GGC 




CCG CTC TAG GAG TGC GTG TAG GGG GCC CGG CGG GGC GCC CCG GCC GTG AAG GGC 
30627 30636 30645 30654 30663 30672 

GGC GAG ATC CTC ACG CAC ATG CGC CGG GCC GCC CCG CGG GGC CGG CAC TTC GCG 

GEILTHMRRAAPRGR HFA 
ARSSRTC AGPPRGAGT SR 
RDPHAHAPGRPAGPALRG 

SGSGCYASCSRR SKGSTV 
RAAAATRRVAAGRSGRP* 
^^D L R Q R L V G F L Q A A V E G L D 

i^^^G CTC GGC GAC GGC GTC ATG CGG CTT GTC GAC GCG GCG CTG AAG GGG CTC CAG 
30681 30690 30699 30708 30717 30726 

GTC GAG CCG CTG CCG CAG TAG GCC GAA CAG CTG CGC CGC GAC TTC CCC GAG GTC 

VEPLPQYAEQLRRDFPEV 
SSRCRSTPNSCAATSP RS 
RAAAAVRRTAAPRLPRGH 

THCAAAAA VGP R S L K TW T 
PIAPRR PRWGQGPCSRGR 
RYPLGGRGGGRAPVAEDV 



TGC CAT ACC GTC CGG CGG 
30735 30744 
ACG GTA TGG CAG GCC GCC 



CGC CGG CGG TGG GGA CCG 
30753 30762 
GCG GCC GCC ACC CCT GGC 



GCC CTG TGG AAG CAG GTG 
30771 30780 
CGG GAC AGC TTC GTC CAC 
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R Y G RPPRP. PPLAGTAS ST 
GMAGRRGRHPWPGQLRPR 

TELGP* LPRRRRGYSRAS 
PRWGRSCRGAGGDTRGRR 
HDGVGAVAAQAAT RVVAG 

CAC CAG AGG TTG GGG CCG ATG TCG CCG GAG GCG GCG GCA GGC ATG CTG GCG CGG 
30789 30798 30807 30816 30825 30834 

GTG GTC TCG AAC CCC GGC TAG AGC GGC CTG CGC CGC CGT CCG TAG GAG CGC GCC 

VVSNPGYSGLRRRPYDRA 
W SPTPATAACAAVRTTAP 
GLQPRLQR PAPPSVRPRR 

S VRSSIATSVTRRSSTTG 
RSGPLSRPPCRVDPRRRG 
VLGQFLDRHVGYTQVVDD 

CTG CTC TGG GAC CTT GTC TAG CGC CAC CTG TGG CAT GCA GAC CTG CTG CAG CAG 
30843 30852 30861 30870 30879 30888 

GAC GAG ACC CTG GAA GAG ATC GCG GTG GAC ACC GTA CGT CTG GAC GAC GTC GTC 

MM.. 

JPi>'D ETLEE lAVDTVRLDD VV 
TR.PWKR SRWTPYV W T T S S 
RDPGRD RGGH RTSGRRRP 

SSARTSRTLTSTSPPSTP 
RPRGRPGP*PPRPPRRPP 
GLVGAHVQDLHVHLAALH 

GGG CTC CTG CGG GCG CAC CTG GAC CAG TTC CAC CTG CAC CTC CCG CCG CTC CAC 
30897 30906 30915 30924 30933 30942 

CCC GAG GAC GCC CGC GTG GAC CTG GTC AAG GTG GAC GTG GAG GGC GGC GAG GTG 

PEDARVDLVKVDVE G GEV 
P R T P A W T W S R W T W R A A R W 
RG R. PRGPG QGGRGGRRGG 

^jm^^^ RRPAASSSRR CDGTTTK 
'^^^^R GARPPRAAAGATGRPPR 
A G Q APR G L Q Q A P L G G H H D 

CCG CGG GAC GCG CCC CGC CGG CTC GAC GAC GCG GCC GTC AGG GGG CAC CAC CAG 
30951 30960 30969 30978 30987 30996 

GGC GCC CTG CGC GGG GCG GCC GAG CTG CTG CGC CGG CAG TCC CCC GTG GTG GTC 

GALRGAAELLRR Q S P VVV 
A P C AGRPSCCAG SPPWWS 
RPARGGRAAAP AVPRGGL 

SCPPSWAIRS*PVVLSSR 
RVRRRGRSARSRCWWRRG 
EFVAAVVRHAVVAGGAVV 



AAG CTT GTG CCG CCG CTG GTG CGC TAG GCG CTG ATG CCG TGG TGG TCG CTG CTG 
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31005 ^ ' v . 31014**^ " 3ra23^ ' * 3ra32 ^*' 3Ta4M^ : 31050- 

TTC GAA CAC GGC GGC GAG CAC GCG ATG CGC GAG TAG GGC AGG AGC AGG GAG GAG 



FEHGGDHAMRDYGTTSDD 
.SNTAATTRCATTAPPATT 
RTRRRPRDARLR HHQR RP 

HASSTSSRP*VSYVRGPQ 
TPAAPRRGRSCATG .GAP S 
QPRQQDVVEAVRQVGQRA 

GAG AGC CGC GAG GAG CAG GTG GTG GAG GCG ATG TGC GAG ATG TGG GAG GGC GCG 
31059 31068 31077 31086 31095 31104 

GTG TGG GCG GTG GTG GTG GAG GAG GTG GGC TAG AGG GTG TAG AGG GTG GCG GGC 

LWALLVDDLGY TLYTLPG 
CGRCWSTT SATR CTPGRA 
VGAAGRRPRLHAVHPAGL 

SAASGPRSRAARAASSRV 
APPPAPGRGPRERRRAAC 
PQRRLRAEV PGSEGGLQ, A 

^fjfkCC GAG CGC CGC GTG GGC GCG GAG GTG GCG CGG CGA GAG CGG CGG CTC GAG GCG 
31 1 1 3 31 122 31 1 31 31 140 31 149 31 1 58 

TGG CTG GCG GCG GAG CGG GGC CTC GAG CGG GCG GCT CTC GCG GCG GAG GTG CGC 

WLAAEPGLDRAALAAELR 
GWRRSRA STGPLSPP SC . A 
A G G G A G P R P G R S R R R A A H 

C H Y K T A ,S R P G R D A R E G R P 
ATTSRRRDRAGTRGNG GL 
RLPVEDGIAPGQGGTGGS 

TGC GTC ACC ATG AAG CAG CGG CTA GCG CGC GGG GAG AGG CGG GCA AGG GGG GCT 
31167 31176 31185 31194 31203 31212 

AGG CAG TGG TAG TTC GTC GCG GAT CGC GGG CGC CTG TGC GCG CGT TCC CGC CGA 

* ^ . . T QWYFVADRGPLSARSPR 
.JftiR SGTSSPIAGPGPPVPPE 
^^^^ AVVLRRR SRAPVRPF PP R 

S TCEVHGICSGGGEGGER 
LLANSMV .SVVAGERAERA 
SFHMR CSRYLQGRGRRGR 

CGT CTT CAC GTA AGC TGT ACT GGC TAT GTT GAC GGG GGA GGG AGC GGA GGG AGC 
31221 31230 31239 31248 31257 31266 

GGA GAA GTG CAT TGG ACA TGA GCG ATA CAA CTG CGG CGT CGC TGG CGT GCG TCG 



GEVHST*PIQLPPPSPPS 
E K C I R IL DRYNCPLPRLPR 
R S A F D (m^ TDTTAPSLA SLA 



?> 

DGFAMDPLGAQERLVDGG 
TGSHWIRSVPRSGSCTVA 
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GCC AGG GGC TTA CGG TAT AGG CCC TOT GGC CGG ACG AGG GCC TCG TGC AGT GGC 
31275 31284 31293 31302 31311 31320 

CGG TCC CCG AAT GCC ATA TCC GGG AGA CCG GCC TGC TCC CGG AGC ACG TCA CCG 

RSPNAI SGRPACSRSTSP 
GPRMPYPGDRPAPGARHR 
VPECHIRETGLLPEHVTA 

EPPLTHQGHAAQQAGGFQ 
KRRC PT SATRPR S L GA S S 

RGAAPHAPRARGASGRRV 

GGA AGG CCG CCG TCC CAC ACG ACC GGC ACG CGC CGG ACG ACT CGG GGC GGC TTG 
31329 31338 31347 31356 31365 31374 

CCT TCC GGC GGC AGG GTG TGC TGG CCG TGC GCG GCC TGC TGA GCC CCG CCG AAC 

PSGGR VCWPCAAC*APPN 
LPAAGCAGRARPAEPRRT 
FRRQGVLAVRGLLSPAEL 

' ^ , • L R H L L R R G A Q D V V G P A G P 
'^iijS SDTC SAAAPR I S SAQRVR 
P T P A P P P P R G S R R R R A C G- 

ACC TCA GCC ACG TCC TCC GCC GCC GGC CGG ACT AGC TGC TGC GGA CCG CGT GGG 
31383 31392 31401 31410 31419 31428 

TGG AGT CGG TGC AGG AGG CGG CGG CCG GCC TGA TCG ACG ACG CCT GGC GCA CCC 

W S .RCRRRR P A* S T T P GA P 
GVGAGGGGRPDRRRLAHP 
E SVQ EAAAGL I D DAWRT R 

GHVVGDPRQLGVLGVRGR 
DMCSVMQVSSGWSGSAAG 
TWAR CWRSAPAGRARRPG 

f CCA GGT ACG TGC TGT GGT AGA CCT GCG ACC TCG GGG TGC TCG GGC TGC GCC GGG 
31437 31446 31455 31464 31473 31482 

-^p5T CCA TGC ACG ACA CCA TCT GGA CGC TGG AGC CCC ACG AGC CCG ACG CGG CCC 

GPCTTPSG R W S P T S P T R P 
VHARHHLDAGAP RARR.GP 
SMHDTIWTLEPHEPDAAP 

DADLVDHVL GR HHGPQRA 
TRMSYTMSLDG T lARSAP 
PGCRTR*PCTGPSPGAP P 

GCC AGG CGT AGC TCA TGC AGT ACC TGT TCA GGG GCC ACT ACC GGG CCG ACC GCC 
31491 31500 31509 31518 31527 31536 

CGG TCC GCA TCG AGT ACG TCA TGG ACA AGT CCC CGG TGA TGG CCC GGC TGG CGG 

RSASSTSWTSPR*WPGWR 
GPHRVRHGQVPGDGPAGG 
VRIEYVMDKSPVMARLAG 
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MRQQQAGHLGQDPRVED G 
WGSSSRAMSVRT PGFKM G 
GDAA AARWPSGPRAS S * G 

CGG TAG GCG ACG ACG ACG CGC GGT ACC TCT GGG ACC AGC CCG GCT TGA AGT AGG 
31545 31554 31563 31572 31581 31590 

GCC ATC CGC TGC TGC TGC GCG CCA TGG AGA CCC TGG TCG GGC CGA ACT TCA TCC 

AIRCCCAPWRPWSGRTSS 
PSAAAARHGDPGRAELHP 
HPLLLRAM ETLVGPNFI p 

GPVAHHELGGRARGPQGP 
VQSLMTNLVVAPAGRSAQ 
W RPCCP T* SWRPRAGAPR 

GGT GGA CCC TGT CGT ACC ACA AGT TCT GGT GGC GCC CGC GCG GGG CCG ACC GGA 
31599 31608 31617 31626 31635 31644 

CCA CCT GGG ACA GCA TGG TGT TCA AGA CCA CCG CGG GCG CGC CCC GGC TGG CCT 

PPG TAWCSRPP RARPGWP 
tvafc HLGQHGVQ .DHRGRAPAGL 
^1^' TWDSMVFKTTAGAP RLAW 

VTVALHVGIGDGDGAATA 
CRS PWIYESATATVPPPR 
AGHR GSTSRHRRR* R RRD 

CCG TGG CAC TGC CGG TCT ACA TGA GGC TAC GGC AGC GGC AGT GGC CGC CGC CAG 
31653 31662 31671 31680 31689 31698 

GGC ACC GTG ACG GCC AGA TGT ACT CCG ATG CCG TCG CCG TCA CCG GCG - GCG GTC 

GTVTARCTPMPSPSPAA V 
AP*RPDVLRCRRRHRRRS 
HRDGQ MYSDAVAVT GGGR 

DDVHADVEVVRGLVVTDP 
TM S T P M * R SWAG S S L Q T Q 

.*RRPCRGRGRARPCSHR 

. ' 



icQC AGT AGC TGC ACQ CGT AGA TGG^ AGC TGG TGC . GCG GGC TCC . TGT TGA CAC AGA - 
31707 31716 31725 31734 31743 31752 

GCG TCA TCG ACG TGG GCA TCT ACC TCG ACC ACG CGC CCG AGG ACA ACT GTG TCT 

ASS TWASTSTTRPRTTVS 
RHRRGHLPRPRARGQLCL 
VIDVGIYLDHAPEDNCVW 

GDRLGVVPLVL LDG L GGV 
AMGCDL*QSSSCTVS VAS 
PWGATWSSPPRAP*RSR R 

CCC GGT AGG GCG TCA GGT TGA TGA CCC TCC TGC TCG TCC AGT GGC TCT GGC GGC 
31761 31770 31779 31788 31797 31806 

GGG CCA TCC CGC AGT CCA ACT ACT GGG AGG ACG AGC AGG TCA CCG AGA CCG CCG 
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g:;^ B-y s^* r * s- ' t t^^'"'g w ' t' ;- . s"^ ' R s" ^ p>- r: p p. 

GHPAVQLLGGRAGHRDRR 
AIPQSNYWEDEQVTETAD 

PEVGGLPVRGPGDGGHHP 
RSLAVSHSAVPATGATIR 
GA*RWR TPRSRP .RGRR SA 

TGG CCG AGT TGC GGT GGC TCA CCC TGC GCT GGC CCC GGC AGG GGC GGC ACT ACG 
31815 31824 31833 31842 31851 31860 

ACC GGC TCA ACG CCA CCG AGT GGG ACG CGA CCG GGG CCG TCC CCG CCG TGA TGC 

TGSTPP SGTRP -GPSPP*C 
PAQRHRVGRDRGRPRRDA 
RLNATEWDATGAVPAVMR 

RAVGQQVVDQCQVAGRRH 
GPSARSCLMRVSCPAGAT 
APRRGAACCGSV ARRGPP 

CCG GCC CGC TGC GGG ACG ACG TGT TGT AGG ACT GTG ACG TGC CGC GGG GCC GCC 
31869 31878 31887 31896 31905 31914 
, GGC CGG GCG ACG CCC TGC TGC ACA ACA TCC TGA CAC TGC ACG GCG CCC CGG CGG 


GRATPCCTTS*HCTAPRR 
AGRRPAA QHPDTARRP GG 
PGDALLHNIL TLH GAPAV 

H A L L A P D D V V L V P G A L H L 
TPL CRL T T* .*SYRGP STS 
PPCAACPRRSRTGARRPP 

ACC ACC CGT TCG TCG CGT CCC AGC AGA TGA TGC TCA TGG CCG GGC CGC TCC ACC 

31923 31932 31941 31950 31959 31968 . 

TGG TGG GCA AGC AGC GCA GGG TCG TCT ACT ACG AGT ACC GGC CCG GCG . AGG TGG 

WWASSAGSST TSTGPARW 
GGQAAQ GRLLRVPARRGG. 
VGK QRRVVYYEYRPGEVE 

W^), TLEARVHGL VHPELLLHQ 
R*SPGCTGSYTPSLCCTS 
A D A R G A R A R T R P A * A A P A 

TCG CAG TCG AGC CGG GCG TGC ACG GGC TCA TGC ACC CCG AGT TCG TCG TCC ACG 
31977 31986 31995 32004 32013 32022 

AGC GTC AGC TCG GCC CGC ACG TGC CCG AGT ACG TGG GGC TCA AGC AGC AGG TGC 

SVSSARTCPST WGSS SRC 
ASARPAR ARVRG AQAAG A 
R QL GP H V P EYV G L K Q Q V L 

ARAQLLPGRGPLVPVLLG 
RAHR S C RAA DP S CR S S S G 
ARTGPAAPRTR PAGPRPA 



ACG CGC GCA CGG ACC TCG TCG CCC GGC GCA GGC CCC TCG TGG CCC TGC TCC TCG 
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32031- * 3204 a- ^ 32049^ - - - 3203«- 3206^^ ■ 320^6- 

TGC GCG CGT GCC TOG AGO AGC GGG CCG CGT CCG GGG AGC ACC GGG ACG AGG AGC 



CARAWS SGPRPGSTGTRS 
•ARVPGAAGRVRGAPGR GA 
RACLEQRAASGEHRDEE] 

ELVARHLLVPEPVLRGRI 
KSYRGTSCYRSQSSDGAI 
R RTGGPPATGARPRTARS 

GGA AGC TCA TGG CGG GCC ACC TCG TCA TGG CCG AGA CCC TGC TCA GCG GGC GCT 
32085 32094 32103 32112 32121 32130 

CCT TCG AGT ACC GCC CGG TGG AGC AGT ACC GGC TCT GGG ACG AGT CGC CCG CGA 

PS STARWSSTGS GTSRPR 
LRVPPGGAVPALGRVARD 
FE YRPVEQYRLWDESPA] 

G AQPERVLLVP PPSGASC 
EPRRNGCSSYQRHHVQQA 
~\RRGATGARPTSAT TFRSL 

"^'fecA GGC CGG ACG CCA AGG GCG TGC TCC TCA TGA CCG CCA CCA CTT GGA CGA CTC 




1^. 32139 32148 32157 32166 32175 32184 

TCT CCG GCC TGC GGT TCC CGC ACG AGG AGT ACT GGC GGT GGT GAA CCT GCT GAG 

SPACG SRTRSTGGGEP AE 
LRPAV PARGVLAV N L L S 

SGLRFPHEEYWRW*TC* 2 

— ^> 

GAAAPRARGPAPAGPRRi 
AQRQQARE GRRRRARAAL 
RRGSSPASA GAGARGPPS 

GGC GGA CGG CGA CGA CCC GCG CGA GCG GGG CCG CGG CCG CGC GGG CCC GCC GCT 
32193 32202 32211 32220 32229 32238 

CCG CCT GCC GCT GCT GGG CGC GCT CGC CCC GGC GCC GGC GCG CCC GGG CGG CGA 

PAAA GRARPGAGAP GRR 
'^^^^R L P L L G A .L A P AP AR P G G E 
A C R C W A R _ S _ P _ R R. R. . R . . A R. . A . A £ 

WRGPP*RR ASGPASRDAC 
GG G LLDDGLAEPLPGIRA 
GVAWSTMASRKRSRVSGR 

CGG GTG GCG GGT CCT CCA GTA GCG GCT CGC GAA GGC CCT CGC CTG GCT AGG CGC 
32247 32256 32265 32274 32283 32292 

GCC CAC CGC CCA GGA GGT CAT CGC CGA GCG CTT CCG GGA GCG GAC CGA TCC GCG 

AHRPGGHRRALPGADR SA 
PTAQEV lAERF RERTDPR 
PPPRRS SPSAS GSGP I Ri^ 

R R S P R R G D A R G G C R A P R 
GAVPGVGMQEVEAVRQGL 
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GGG GCC GCT GAG CCG GAT GOG GGT AGA CGA GOT GGA GGC GTT GOG CGA COG GOT 
32301 32310 32319 32328 32337 32346 

CCC CGG CGA CTG GGC CTA CGC CCA TCT GCT CGA CCT CCG CAA CGC GCT GGC CGA 

PRRLGLRPSAR PPQRA GR 
PGDWAYAHLLDLRNALAE 
PATGPTPICSTSATRWPS 

ARRPTPASARSRLPCRAT 
LEGPRRPAPEVESRAGRR 
CSAPADPRQSSKPAPVEG 

CGT CGA GCG GCC CCG CAG CCC CGC GAC CGA GCT GAA GCC TCG CCC GTG GAG CGG 
32355 32364 32373 32382 32391 32400 

GCA GCT CGC CGG GGC GTC GGG GCG CTG GCT CGA CTT CGG AGC GGG CAC CTC GCC 

AARR GV G ALARL R S G H L A 
Q LAGA S GRWLDF GAGT S P 
SSPGRRGAGSTSERAPRR 

<^ R G A G R R G A P S P R S A R R R 
hjf VAVQEGAGPQLRGLHAAA 
J^^'^ YRSRSGPARSSV ASIRPP 

CAT GGC GCT GGA CGA GGG GCC GCG GGC CGA CCT CTG CCG GCT CTA CGC GCC GCC 
32409 32418 32427 32436 32445 32454 

GTA CCG CGA CCT GCT CCC CGG CGC CCG GCT GGA GAC GGC CGA GAT GCG CGG CGG 

VPRPAPRRPAGDG RDAR R 
YRDLL PGARLETAEMRGG 
TAT CSPAPGWRRPRCAAA 

PGSPPD RAPRPR ATRGAP 
LVQRRI VLQV LGPQAAQR 
SSRVAS*SSSSAPSHPR G 



( ' GCT CCT GGA CTG CCG CCT AGT GCT CGA CCT GCT CCG GCC CGA CAC GCC GGA CGG 
^< 32463 32472 32481 32490 32499 32508 

^GA GGA CCT GAC GGC GGA TCA CGA GCT GGA CGA GGC CGG GCT GTG CGG CCT GCC 



R G P D G G S R A G R G R A V R P A 
EDLTADHELDEAGLCGLP 
RT* RRITSWTRPGCAACR 

R STRRHARWGPGPVR .S P G 
VAREVTHEGGLDQFVHRV 
SPENSPTSEVWTRSCTVS 

CCT GCC GAG CAA GCT GCC ACA CGA GAG GTG GGT CCA GGA CCT TGT GCA CTG CCT 
32517 32526 32535 32544 32553 32562 

GGA CGG CTC GTT CGA CGG TGT GCT CTC CAC CCA GGT CCT GGA ACA CGT GAC GGA 

GRLVRRCALHPGPGTRDG 
DGSFDGVLSTQVLEHVTD 
TARST VCSPPRSWNT*RT 
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PGADARPAGAAAAPRCAP 
RVQMQALREPQQPRAAPQ 
GSRCRRSASRSSRGPPLS 



GGG CCT GGA CGT AGA CGC GCT CCG CGA GGC CGA CGA CGC CGG CCC GCC GTC CGA 
32571 32580 32589 32598 32607 32616 

CCC GGA CCT GCA TCT GCG CGA GGC GCT CCG GCT GCT GCG GCC GGG CGG CAG GCT 

PGPASARGAPAAAAGRQA 
PDLHLREALRLLRP GGRL 
RTCICARRSGCCGRAA GW 

ATWAHRRPPARRAPGT AS 
HQGRMADPLLVAPLVQPA 
TSDVCPTQSSCPPCSRHR 

CCA CGA CAG GTG CGT ACC GCA GAC CCT CCT CGT GCC GCC CGT CCT GGA CAC CGC 
32625 32634 32643 32652 32661 32670 

GGT GCT GTC CAC GCA TGG CGT CTG GGA GGA GCA CGG CGG GCA GGA CCT GTG GCG 

GAVHAWRLGGARRAGPVA 
^^.-^ VLSTHGVWEEHGGQDLWR 
1^ CCPRMASGRSTAGRTCGA 

SR RRVRPGPRAPRT *RP G 
P GGV SE RGL GL 'P GP E G HV 
QVASPSAAWASRAPNVTS 

GAC CTG GCG GCT GCC TGA GCG CCG GGT CCG GCT CGC CCG GCC CAA GTG GCA CCT 
32679 32688 32697 32706 32715 32724 

CTG GAC CGC CGA CGG ACT CGC GGC CCA GGC CGA GCG GGC CGG GTT CAC CGT GGA 

LDRRRTRGPGRAGRVHRG 
WTADGLAAQAERAG FTVD 
GPPTDSRP RPSGPGSPWT 

FP*A*RRVARDAAGAASG 
SRDLEGASRATQQE QQAV 
"^ aR V T L S V Q P G R P R S S R S R * 

m. 



' ^^'GGC TTG CCA GTT CGA GTG GAC GCC TGG CGC GCC AGA CGA CGA GGA CGA CGC GAT 
32733 32742 32751 32760 32769 32778 

CCG AAC GGT CAA GCT CAC CTG CGG ACC GCG CGG TCT GCT GCT CCT GCT GCG CTA 

PNGQAHLRTARSAAPAAL 
RTVKLTC GPRGLLLL. LRY 
ERSSSPA DRAVCCSCCAT 

R GPA RSAPPRD PRAAAAS 
V- APLVAPRRATRDPQQQP 
WPRSCPQGAPPGTPSSSR 



GGT GCC GGC CCT CGT GCC GAC CGG CCG 
32787 32796 32805 

. CCA CGG CCG GGA GCA CGG CTG GCC GGC 



CCC GCC AGG CCA GCC CGA CGA CGA CGC 
32814 32823 32832 

GGG CGG TCC GGT CGG GCT 'GCT GCT GCG 
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P^- R . El r G^'^ 'R--^ -^E*^- A '^ G*^ ' G" ' ' R" ' S^: G* ^ R-^ A A " A A 

HGREHGWPAGGPVGLLLR 
TAGSTAGRRAVRSGCCCG 

GPGPRGAAGAGRRRSGRG 
GQGQGVPQARAEDVV VEV 
VRARASRSRGRRTSS*RS 

CTG GGA COG GGA CCG GCT GGC CGA CGC GGG CGC GGA GCA GOT GCT GAT GGA GCT 
32841 32850 32859 32868 32877 32886 

GAG OCT GGC OCT GGC CGA CCG GCT GCG CCC GCG CCT CGT CGA CGA CTA CCT CGA 

DPGPGR PAAPAPRRRLPR 
TLALADRLRPRLVDDYLD 
PWPWPTGCARASSTTTST 

PRRRGLGR RPGPRATRGP 
PDEGALAADLARGLREVQ 
RTKAPWPRTSPGASGN*R 

GGC CCA GAA GCG GCC GGT TCC GGC GCA GCT CCC GGG CCG GCT CGG CAA GAT GGA 
32895 32904 32913 32922 32931 32940 

'GCG GGT CTT CGC CGG CCA AGG CCG CGT CGA GGG CCC GGC CGA GCC GTT CTA CCT 



^^PGLRRPRPRRGPGRAVLP 
RVFAGQGRVEGPAE PFYL 
GSSPAKAASRARPSRSTW 

C G A S R W C A A R A P S A P S P R 
VDQQGGALRALRLLRLPV 
SMRSVALLGRSGSFGSLS 

CCT GTA GGA CGA CTG GCG GTC GTT CGG CGC GCT CGG CCT CTT CGG CCT CTC CCT 
32949 32958 32967 32976 32985 32994 

GGA CAT CCT GCT GAC CGC CAG CAA GCC GCG CGA GCC GGA GAA GCC GGA GAG GGA 

GHPADR QQAARAGEAGEG 
D I .L L T A S K P RE P E K P E R D 
TSC*PPASRASRRSRRGT 

Wm SIVWGGGLGVMHTSGHIW 

'"'^^ R Y S G A G A WDWWT HAA T S G 
A I H G L G R G T G G H T H Q R P D 

GCG CTA TAG TGG GTC GGG GGC GGG TGA GGG TGG TAG ACA CAC GAC GGC ACC TAG 
33003 33012 3302T 33030 33039 33048 

CGC GAT ATG ACC CAG CCC CCG CCC AGT CCC ACC ATG TGT GTG CTG CCG TGG ATC 

R D TQP PPSPTMCVLPWI ^ 1^ 

AI*. PSPRPVPPCVCCRGS 
RYDPAPAQSHH VCAAVDP 



RHAEMSPT*PRQQTSSEI 
GTRRWRRHRRGSSHPRSS 
VQAGGDVTDVAAATHVVR 



GTG GAC ACG CGG AGG TAG CTG CCA CAG ATG CCG GCG ACG ACA CAC CTG CTG AGC 
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3305:7:. 330S6 33075"*^ 33084'*^ 33093"^'"^ 33102 

CAC CTG TGC GCC TCC ATC GAG GGT GTC TAG GGC CGC TGC TGT GTG GAG GAG TGG 



HLGASI DGVYGRCGVDDS 
.TCAPPST VSTAAAVWTTR 
PVRLHRRCLRPLLG .GRLD 

YWLSSYSDSASGTKLSLA 
TGGRATRIRPPAPR* A*R 
HVVVLQVFGLRLRDELEV 

TAG ATG GTG TTG GTC GAG ATG GTT AGG GTG GGC CTG GGC GAG AAG TTC GAG TTG 
33111 33120 33129 33138 33147 33156 

ATG TAG GAG AAG GAG CTG TAG GAA TCC GAG GCG GAG CCG GTC TTC AAG GTC AAC 

MYH NELYESEAEPVFKLN 
CTTTSCTNPRRSRSSSST 
VPQRAVRIRGGAGLQAQR. 

SATPQAGLER*ACSLGS S 
RRQRSRAWSGSRVPCD RH 
GVSDAARGVGAVCLVIGI 

V^!I:GG CTG CGA CAG CCG ACG CGC GGG TTG AGG GCG ATG CGT GTC CTG TTA GGG CTA 
33165 33174 33183 33192 33201 33210 

GCC GAG GGT GTC GGC TGG GCG CGC AAC TCC CGC TAG GCA CAG GAC AAT CCG GAT 

ADAVGCAPNSRYA QDNPD 
PTLSAARPTPATHRT I PM 
RRCRLRAQLPLRTGQSR* 

TLPSVSANLLGLMRRVRS 
P*LASRPT*CGWCAAS GA 
LDSPQGLREVAGVHPPGP 

CTG CAG TGT CCG GAC TGG CTG CGC AAG TTG TGG GGG TTG TAG GCC GCC TGG GCC 
33219 33228 33237 33246 33255 33264 

GAG GTC AGA GGG CTG ACC GAG GCG TTC AAC AGG CCG AAC ATG GGG CGG ACG GGG 

.^/E VRGLTEAFNSPNMRRTR 
RSEG*PRRSTAPTCGGP G 
G Q R A D R G V Q Q P Q H A A D P A 

A I SAP S R T DAH S * Q * * R S 
PSAPRRARTRTRSSSDGR 
QRHQGALAHGRA .VVAIVA 

GAC CGC TAG GAC CGG CCG CTG GCG CAC AGG CGC ACG CTG ATG ACG ATA GTG GCG 
33273 33282 33291 33300 33309 33318 

CTG GCG ATG CTG GCC GGC GAG CGC GTG TCC GCG TGC GAC TAG TGC TAT CAC CGC 

LAMLAGERVSACDYCYHR 
WRCWPASACPRATTAITA 
GDAGRRARVRVRLLL SPR 

SRPAV D * RCLML SRNAS V 
PGPRSTRGAS C*RATRRC 
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CTC CTG GCC CCG CGC TGC AGG ATG GCC GTC TCG TAG TTG CTC GCC AAG CGG CTG 
33327 33336 33345 33354' 33363 33372 

GAG GAG CGG GGC GCG ACG TCC TAG CGG GAG AGC ATC AAC GAG CGG TTC GCC GAC 

EDRGATSYRQSINERFAD 
RTGARRPTGRASTSGSPT 
GPGRDVLPAEHQRAVRRH 

TSKA SRASRVAGSPENSS 
PPSRRDPRVYRGRRSTRP 
RHVEGI QGFTGGGVAREL 

TGC CAC CTG AAG CGG CTA GAC CGG CTT GCA TGG CGG GGG CTG CCG AGC AAG CTC 
33381 33390 33399 33408 33417 33426 

ACG GTG GAC TTC GCC GAT CTG GCC GAA CGT ACC GCC CCC GAC GGC TCG TTC GAG 

TVDFADLAERTAPDGSFE 
RWTSPIWPNVPPPTARSR 
GG LRRSGRTYRPRRLVRG 

^,, NGKKRSMRNPLVQLRRHT 
\W TGRRGRCGTRCCRCGATR 
LEGEEEVDPEAVGAVQPA 

CTC AAG GGG AAG AAG GAG CTG TAG GCC AAG CCG TTG TGG ACG TTG GAC GCC ACG 
33435 33444 33453 33462 33471 33480 

GAG TTC CCC TTC TTC CTC GAC ATC CGG TTC GGC AAC ACC TGC AAC CTG CGG TGC 




CAC TAG ACG CGG ATG GGC GAG TCG AGG CCG ACC CCA CGG TTC TTC GCG GGC TTT 
33489 33498 33507 33516 33525 33534 

WmiG ATG TGC GCC TAG CCG GTG AGC TCC GGC TGG GGT GCC AAG AAG CGC CCG AAA 

V M CAY P * V S S G W G A K K R P K 
*CAPTRSAPAGVPRSARN 
DVRLPGQLRLGCQEAPEM 

DDATISGYRSS SSSHAVS 
TTRP SRGTGPPRPA TP SA 
PRGRHDVRVPLVLLQPRR 

ACC AGC AGG CGC CAC TAG CTG -GGC ATG GCC CTC CTG CTC CTC GAC ACC CGC TGC 
33543 33552 33561 33570 33579 33588 

TGG TCG TCC GCG GTG ATC GAC CCG TAG CGG GAG GAC GAG GAG CTG TGG GCG ACG 




RSFAWRMRRSYKAPPSGK 
ARS RGG*GAATSRPRRAR 
QALVGVEDPPQVERAALG 

GAG GCG CTC TTG CGG GTG GAG TAG GCC GCC GAG ATG AAG CGC CCG CCG CTC GGG 
33597 33606 33615 33624 33633 33642 

CTG CGC GAG AAC GCC CAC CTC ATC CGG CGG CTG TAG TTC GCG GGC GGC GAG CCC 




AAG TAG GTC GGG CCG GTG AAG CGC TAC GAG CTG GAG GAG TAG CTC TGG CCG TTG 
33651 33660 33669 33678 33687 33696 

TTC ATG GAG CCC GGC CAC TTC GCG ATG CTG GAC CTG CTG ATC GAG ACC GGC AAC 



w 




FMQPGHFAMLDLLI ETGN 
SCSPATSRCW TC*SRPAT 
b HAARPLRDAG PADRDRQI 



SFTSMT * LEL RVT SG .S FT 
PFRRC RRCSWG*PAAPSP 
RF VDVDDVVGVERHQRLL 



CGC CTT TTG GAG CTG TAG GAG ATG TTG AGG TTG GAG TGC CAC GAC GGC CTC TTC 
33705 33714 33723 33732 33741 337*50 

GCG GAA AAC GTC GAC ATC GTC TAC AAC TCC AAC CTC ACG GTG CTG CCG GAG AAG 

AENVD I VYN SNL TVL P E K 
RKTST SS TTPTSRCCRRR 
G K R R H R L Q L Q P H G A A G E G 

KSRKGCKLLTPIPAD QS P 
RRGS GAS * SRRSRRTRRR 
..nD E V A E R V E L A D P D A R G A V 
W„ . 

^ CAG AAG CTG GCG AAG GGC GTG AAG TTC TGG GAG CCC TAG CCG CGC AGG ACG CTG 
33759 33768 33777 33786 33795 33804 

GTC TTC GAC CGC TTC CCG CAC TTC AAG AGC GTC GGG ATC GGC GCG TCC TGC GAC 

VFDRFPHFKSVGIGASCD 
SSTASRTSRASGSARPAT 
LRPLPALQERRDRRVLRR 

TPSTK SRMRWG AFHSTKT 
RRRPRRA CGGARSTPRRR 
ADALDELAD.ALGRLPVDE 



CCG CAG CCG CTC CAG AAG CTC GCG TAG 
33813 33822 33831 

GGC GTC GGC GAG GTC TTC GAG CGC ATC 



GCG GTC GGG CGC TTC ACC CTG CAG AAG 
33840 33849 33858 

CGC CAG CCC GCG AAG TGG GAC GTC TTC 
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ASARSSSASAS PRSGTSS 
RRRGLRAHPPAREVGRLI 

AFTRRALVSTFRHSWTAC 
RSRVGHWSRPSGTAGPR G 
DRVYATGLGLHVQPELDG 

GAG CGC TTG CAT GCG GCA CGG TTC TGG CTC GAG TTG GAG AGG GAG GTG GAG GGG 
33867 33876 33885 33894 33903 33912 

GTG GGG AAC GTA GGG GGT GCG AAG AGG GAG GTG AAG GTG TGG GTG GAG GTG GGC 

VANVRRAKTEVNLWLQVA 
SRTYAVPRPR*T GGSRSP 
RERTPG .QDRGEPVAPGR] 

CRSFRHPSRSRSSK ARS i 
AAASGTPVAPGAARRGRP 
R' L P Q V Q P S Q P V Q Q E E G A L 

GGG GTG GGC GAG TTG GAG AGG GGT GAG GGG GTG GAG GAG GAG AAG GGG GGG GTG 
33921 33930 33939 33948 33957 33966 

y^CG GAG GGG GTG AAG GTG TGG GGA GTG GGG GAG GTG GTG GTG TTG GGG GGG GAG 

yp. _ 

^>^'pqrl .nlwglrdlllfare 
rsg* t ggdggtggsspar 
aaaepvgtagpaalrprc 

p rsasralttghgssrd: 
pg rrp gpwhratarrgtp 
l a e v r v q g i d h l p g v v q r 

GTG GGG GAG GTG GGG GTG GAG GGG TTA GAG GAG GTG AGG GGG GTG GTG GAG AGG 
33975 33984 33993 34002 34011 34020 

GAG GGG GTG GAG GGG GAG GTG GGG AAT GTG GTG GAG TGG GGG GAG GAG GTG TGG 

EGLDADLANVVQWPDDLS 
RASTRTWPMSCSGPTTCR 
; GPRRGPG QGRAVARRPV( 

iJjlp ALR GSSSFRRAVTSSASS 

' ^ R W D G P R P S .A V P S R . R A P R V 
D G I E R V L L L S P R G D L Q G F 

GAG CGG TTA GAG GGC GTG CTC CTC TTG GGT GCG CGC TGG GAG GTG GAG CGG CTT 
34029 34038 34047 34056 34065 34074 

GTG GCG AAT CTC GCG GAG GAG GAG AAG CGA GGG GCG AGG GTG GAG GTG GCG GAA 

VAN .LPDEEK RRATVELAE 
SP I S RT RRSDGR P S S WP N 
R Q S P .G R G E A T G D R R A G R 1 

ASHHSP. RSQLLGAAWRR/ 
RRTTRRGPSSCARRGDAP 
EGLPAVAQVPALGGGMQP 



GAG CGG CTC ACC AGG GTG CGG GAG GTG AGG TGG TTC GGG CGG CGG GTA GAG GCG 
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34083^' 3A092^^^''^' 34T0T ^ . • 34^-1^0-^:- - • 341^:9- • ~ 34128 

CTC GCC GAG TGG TGC GAC GGC CTG GAG TGG AGC AAG CCC GCC GCC CAT CTG CGG 



I 



LAEWCDGLDWSKPAAHLR 
SPSGATAWTGASPPPICG 
RRVVRR P G L EQA R R P S A G 

SLANMFAASGDSSIASPP 
ASRT*SRRQ GT.RVSRRLL 
RQAREHVGSVRGFQDGFS 

GGC GAC TCG CGC AAG TAG TTG CGG CGA CTG GGC AGG CTT GAC TAG CGG CTT CCT 
34137 34146 34155 34164 34173 34182 

GCG CTG AGC GCG TTC ATG AAC GCC GCT GAC CCG TCC GAA CTG ATC GCC GAA GGA 

ALSAFMNAAD PSELIAE.G 
R* ARS*TPLTRPN*SPK E 
AE RVHERR*PVRTDRRRR 

THAPRRFSGQN GL PQAL G 
LILPDAFAARTASPSR 'LV 
SYSRTP SLQGPQR PAACS 

^^ifecT CAT ACT CGC CCA GCC GCT TTC GAC GGG ACC AAC GGC TCC CCG ACG CGT TCT 
34191 34200 34209 34218 34227 34236 

GGA GTA TGA GCG GGT CGG CGA AAG CTG CCC TGG TTG CCG AGG GGC TGC GCA AGA 



GV*AGRRKLPWLPRGCAR 
.EYERVGESCPGCRGAAQD 
S ^m) SGSAKAAL VAEGLRKT 



VSGLRRQVPEVEDHGLAG 
* P D S V A S S P N S R T T G S P V 
RRIRSPAPRTR GRRARP C 

GGA TGC CTA GGC TCT GCC GCG ACC TGC CCA AGC TGG AGC AGC ACG GGC TCC CGT 
34245 34254 34263 34272 34281 34290 

CCT ACG GAT CCG AGA CGG CGC TGG ACG GGT TCG ACC TCG TCG TGC CCG AGG GCA 

TDPRR RWTG ST S S CP RA 
fiip^ LR IRDGAGRVRPRRARGH 
Y G S ETA L D G F D L V V P.E G T 

HAGQ ETGVARALGGGYAD 
THARSPGLPAPLVVATRM 
RTRGARDWRRPCSWRRVC 

GGC ACA CGC GGG ACG AGC CAG GGT TGC CGC GCC CGT TCT GGT GGC GGC ATG CGT 
34299 34308 34317 34326 34335 34344 

CCG TGT GCG CCC TGC TCG GTG - CCA ACG GCG CGG GCA AGA CCA CCG CCG TAG GCA 

PCAPCSVPTARARPPPYA 
RVRPARSQRRGQDHRRTH 
VCALLGPNGAGKTTAVR I 

QAGQE LRVAATGQHGAE I 
RLVRSLGSPPRARTAPRS 
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AGG ACT CGT GGG ACG AGT TCG GCC TGC CGC CGG CAC GGG ACC ACC GGC CGG AGC 
34353 34362 34371 34380 34389 34398 

TCC TGA GCA CCC TGC TCA AGC CGG ACG GCG GCC GTG CCC TGG TGG CCG GCC TCG 




S*APCS SRTAAVPWWPAS 
PEHPAQAGRRPCPGGRPR 
LSTLLK .PDGGRALVAGLI 

HGALGGLHAPVDADGALA 
TVRSAASTRRFMPTVPWY 
HSGRPRRPAGSCRR*RGT 

TAC ACT GGG CGC TCC GGC GGC TCC ACG CGG CCT TGT AGC CGC AGT GGC CGG TCA 
34407 34416 34425 34434 34443 34452 

ATG TGA CCC GCG AGG CCG CCG AGG TGC GCC GGA ACA TCG GCG TCA CCG GCC AGT 

M*PA. RP PRCAGT SAS PAS 
CDPRGRRGAPEHRRHRPV 
VTREAAE VRRN I GVT GQ ^ 

RRDLLDQGAALVQLH PAi 
Jlff^ GATSS I RVPRSF RS I HPR 

'gpprp sgsrgrsgpst pg 

TGG GCC GCC AGC TCC TCT AGG ACT GGC CGG CGC TCT TGG ACC TCT ACA CCC CGG 
34461 34470 34479 34488 34497 34506 

acc cgg cgg tcg agg aga tcc tga ccg gcc gcg aga acc tgg aga tgt ggg gcc 

tr rsrr s * paar twr c ga 
pggrgd p drprepgdvgp 
paveei ltgrenlemwgi 

evvhaaplrlatrf fqqi 
r *wtprlsacrrvss s s s 
grgrpgcppaagyplvap 

cgg aga tgg tgc acc cgg cgt ccc tcc gcg tcg cgg cat gcc ttc ttg acg acc 
34515 34524 34533 34542 34551 34560 

.^^CC TCT ACC ACG TGG GCC GCA GGG AGG CGC AGC GCC GTA CGG AAG AAC TGC TGG 

A S T -T W A A G R R S A V R K N C W 
PLP RGPQGGAAPYGRTAG 
LYHVGRREAQRRTEELLI 

LEVQ GLGGVLPELVVRA1 
CNSRVSAAS LRSLC* EPP 
ATRGSRPRRCAA*AS SPR 

TCG TCA AGC TGG ACT GGC TCC GGC GGC TGT TCG CCG AGT TCG TGA TGA GCC CGC 
34569 34578 34587 34596 34605 34614 

AGC AGT TCG ACC TGA CCG AGG CCG CCG ACA AGC GGC TCA AGC ACT ACT CGG GCG 

S SST*PR. PP TSGSSTTRA 
AVRPDRGRRQAAQALLGR 
QFDLT EAAD KRLKHY SGG 

- 135- 



HPAPE VQGGSEEG HGLHE 
I RRLSS RAAPNK VTGLT S 
YAACARGPRRIR*RAWPA 



CAT ACG CCG CGT CCG AGC TGG ACC GGC GGC CTA AGA AGT GGC ACG GGT TCC ACG 
34623 34632 34641 34650 34659 34668 

GTA TGC GGC GCA GGC TCG ACC TGG CCG CCG GAT TCT TCA CCG TGC CCA AGG TGC 

VCGAGSTWPPDSSPCPR C 
YAA QARPGRRIL HRAQGA 
MRRRLDLAAGFFTVPKVL 

EQVLGGGAEVRAVAV LDP 
KRSSGVVPRSGRLRLSTQ 
R GPRAWWRGRGA CGCRPR 

AGA AGG ACC TGC TCG GGT GGT GGC CGG AGC TGG GCG CGT TGG CGT TGC TCC AGA 
34677 34686 34695 34704 34713 34722 

TCT TCC TGG ACG AGC CCA CCA CCG GCC TCG ACC CGG GCA ACC GCA ACG AGG TCT 

SSWTSPPPASTRATATRS 
LPGRAHHRPRPAQPQRGL 
yM' FL DEPTTGLDPRNRNEVW 



LH DTRHDL LAGGHQEGR L 
FI TREITSCPVVTSSVVC 
SSPGNSPRAPCWRAA*WA 

CCT TCT ACC AGG CAA GCT ACC AGC TCG TCC CGT GGT GGC ACG ACG AGT GGT GCG 
34731 34740 34749 34758 34767 34776 

GGA AGA TGG TCC GTT CGA TGG TCG AGC AGG GCA CCA CCG TGC TGC TCA CCA CGC 

GRWSVRWSSRAPPCCSPR 
EDGP FD GRAG HHRAAHHA 
KMVR SMVEQGTTVLLT TQ 

VQLLGVPEGVLDR HDVRA 
YRSSASRSASW I E TI SAP 
•^%T GPPPRGARRG SRPSRRP 

^ 

TCA TGG ACC TCC TCC GGC TGG CCG AGC GGC TGG TCT AGA GCC ACT AGC TGC GCC 
34785 34794 34803 34812 34821 34830 

AGT ACC TGG AGG AGG CCG ACC GGC TCG CCG ACC AGA TCT CGG TGA TCG ACG CGG 

STWRRPTGSPTRSR* STR 
VPGGGRPARRPDLGDRRG 
Y LEEADRLADQ I SVI DAG 

A P D D L A G G L G Q L G Q H A A V 
RPTTSPVGSVRFDRTPPS 
GRPR RPCGRSGSTGPPRR 



CGG CGC CCC AGC AGC TCC CGT GGG GGC 
34839 34848 34857 

GCC GCG GGG TCG TCG AGG GCA CCC CCG 



TCT GGG ACT TCA GGG ACC ACC CGC CGC 
34866 34875 34884 

AGA CCC TGA AGT CCC TGG TGG GCG GCG 
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PRGRRGHPRDPEVPGGRR 
RGVVEGTPETLKS LV GGD 

PD-HHGQRGGLVQRGGRSL 
R. ITTVRA AVSSRDAAAA* 
GSRPSGPPWRPGTPRRPE 

TGG CCT AGC ACC ACT GGG ACC GCC GGT GGC TCC TGG ACA GCC GGC GGC GCC GAG 
34893 34902 34911 34920 34929 34938 

ACC GGA TCG TGG TGA CCC TGG CGG CCA CCG AGG ACC TGT CGG CCG CCG CGG CTC 

TGSW*PWRPPRTCRPPRL 
PDRGDPGGHRGPVGRRGS 
RIVVTLAATEDLS AAAAQ 

DGAERPGLGLHVGLGATD 
TAR KVPVSGSTSASARRI 
P RGS*PSRARPPRRPGGY 

TCC AGC GGG CGA AGT GCC CCT GGC TCG GGC TCC ACC TGC GGC TCC GGG CGG CAT 
34947 34956 34965 34974 34983 34992 

\^GG TCG CCC GCT TCA CGG GGA CCG AGC CCG AGG TGG ACG CCG AGG CCC GCC GTA 

y'^R SPASRGPSPRWTPRPAV 
GRPL HGDRARGGRRGPPY 
VAR FTGTEPEVDAEA RR I 

VRRYAVPDAVEHLDHLQQ 
SAGTRSRTPSRTS ITCSS 
RRAPVRGPRRGRPSRAA A 

AGC TGC GCG GCC ATG CGC TGG CCC AGC CGC TGG AGC ACC TCT AGC ACG TCG ACG 
35001 35010 35019 35028 35037 35046 

TCG ACG CGC CGG TAC GCG ACC GGG TCG GCG ACC TCG TGG AGA TCG TGC AGC TGC 

STR'RYATGSATSWRSCS C 
RRAGTRPGRRPRGDRAAA 
DAPVRDRVGDLVE I VQLL 



^ A PLAVAHD IHRQAARRQ I 
R P C P W P T T S T D S R R G V S S 
A R A P G R R P R H T A A G G SAP 

ACG CGC CCG TCC CGG TGC CGC ACC AGC TAC ACA GCG ACG CGG CGG GCT GCG ACC 
35055 35064 35073 35082 35091 35100 

TGC GCG GGC AGG GCC ACG GCG TGG TCG ATG TGT CGC TGC GCC GCC CGA CGC TGG 

CAGRATAWSMCR>CAARRW 
ARA . G P R R GR CVA A P P D A G 
RGQGHGV VDVS LRRPTLD 

VHEQVRGVTGTSPLLRDS 
STNRCAVLRAPRL FSGTP 
HRTGARSWGHRDFSPAPR 



TAC TGC ACA AGG ACG TGC GCT GGT TGG CAC GGC CAG CTT CCT TCC TCG GCC AGC 
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35103:.^: 35118^-^ '^'^ 351^7^ > v 3ST3'6'> - 3 :S1i4S ' : 35154 

ATG ACG TGT TCC TGC AGO CGA CCA ACC GTG CCG GTC GAA GGA AGG AGC CGG TCG 



MTCSCTRPTVPVEGRSRS 
.* RVPARDQPCRSKE GA GR 
DV .FLHATNRAGRRKEPVG 

SPRA PFPGSPR*RRSPPR 
HHGHQSPGA PGDGVAPHD 
IIAT SPLARQATVSPQ TT 

CTA CTA CCG GCA CGA CCC TTC CCG GGC GAC CCG GCA GTG GCT GCC GAC CCA CCA 
35163 35172 35181 35190 35199 35208 

GAT GAT GGC CGT GCT GGG AAG GGC CCG CTG GGC CGT CAC CGA CGG CTG GGT GGT 



ddgragkgplgrhrrlgg 
(h) mavlgrarwavtdg 
*wpcwegpagpspta 



W V V rTJ^n 



grwcs*saacdrasrrsc 
a a g v h d v p p a i g p q d e v a 

PRALMI L QRRL GPSIK*Q 

x^l^CC GGC GCG GTT GTA CTA GTT GAC CGC CGC GTT AGG GCC CGA CTA GAA GAT GAC 
' 35217 35226 35235 35244 35253 35262 

CGG CCG CGC CAA CAT GAT CAA CTG GCG GCG CAA TCC CGG GCT GAT CTT CTA CTG 

RPRQHDQLAAQS RADLLL 
GRANMI NWRRNPGL I F YC 
AAPT*STGGAIPG*SSTA 

STGS * SPPRRTRTRCRWT 
HHERDHRHD EPVHEAAG H 
MINGIMVTTKP YTNPLAM 

GTA CTA CAA GGG CTA GTA CTG CCA CCA GAA GCC CAT GCA CAA GCC GTC GCG GTA 
35271 35280 35289 35298 35307 35316 

CAT GAT GTT CCC GAT CAT GAC GGT GGT CTT CGG GTA CGT GTT CGG CAG CGC CAT 

y^^H DVPD HDGGLRVRVRQRH 
MMFP IMTV VFGYVFGSAM 
* C S R S * R W S S G T C S A A P C 

RPP RRHSGRTGSAPATRV 
GHRAATVVALEQHRPQES 
DTAPPP S*RSNR IGPSNP 

CAG GCA CCG CCC GCC GCC ACT GAT GGC GCT CAA GGA CTA CGG CCC CGA CAA GCC 
35325 35334 35343 35352 35361 35370 

GTC CGT GGC GGG CGG CGG TGA CTA CCG CGA GTT CCT GAT GCC GGG GCT GTT CGG 

vrggrr *lprvpdagavr 
svagggdyreflmpglfg 
pw raavttass*crgc sd 

pss'trhr*wcapr*wrpr 
lrhhetd dgahqgdgard 
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TGT CCG CTA CTA CAA GCC ACA GCA GTG GTC GTA CGA CCG GCA GTG GTC GCG CCA 
35379 35388 35397 35406 35415 35424 

ACA GGC GAT GAT GTT. CGG TGT CGT CAC CAG CAT GCT GGC CGT CAC CAG CGC GGT 



TGDDVRCRH QHAGRHQRG 
QAMMFGVVTSMLAVTSAV 
RR*CSVSSPACWPSPARf 

GPRSRGTGSSASPATPRI 
GPAHGVPEARHRHRLRAD 
ERPTV. SRNREIGIACDPT 

GAG GGC CCC GCA CTG GCT GGC CAA GGC GAG CTA CGG CTA CCG CGT CAG CCC GCA 
35433 35442 35451 35460 35469 35478 

CTC CCG GGG CGT GAC CGA CCG GTT CCG CTC GAT GCC GAT GGC GCA GTC GGG CGT 

LPGRDRPVPLDADGAVGR 
SRGVTDR FRSMPMA Q S G V 
PGA*PTGSARCRWRSR A! 

APGCSRRCT*SASRA*S( 
y^' RQAAAEGVHEARQDLERD 
^ASPRLKASMNLESISSVI 

CCG CGA CCC GGC GTC GAA GCG GCT GTA CAA GTC GAG CGA CTA GCT CGA GTG CTA 
35487 35496 35505 35514 35523 35532 

CGC GCT GGG CCG CAG CTT CGC CGA CAT GTT CAG CTC GCT GAT CGA GCT CAC. GAT 

R A G P Q L R R H VQ L A D R A H D 
ALGRSFADMFSSLIELT I 
RWAAASPTCSAR*SSSRi 

GRSRVAPRSASARPGRC] 
EEAASQQDAPAPVLAGAL 
R .RPQPSSTPQRQCSPGPL 

. GGA GGA GCC GAC GCC TGA CGA CCA GCC GAC CGC GAC CGT GCT CCC GGG GCC GTT 
^ 35541 35550 35559 35568 35577 35586 

'^CT CCT CGG CTG CGG ACT GCT GGT CGG CTG GCG CTG GCA CGA GGG CCC CGG CAA 

P P R L R T A G R L A L A R G P R Q 
LLGCGLLVGWRWHEGPGK 
SSAADCW SAGAGTRAPAI 

APPARAAAATASSA*RPI 
RQRREPQQQQPAVREDP D 
ASAASPSSSSHR*ESMQT 

CCG CGA CCG CCG CGA GCC CGA CGA CGA CGA CAC CGC GAT GAG CGA GTA GAC CCA 
35595 35604 35613 35622 35631 35640 

GGC GCT GGC GGC GCT CGG GCT GCT GCT GCT GTG GCG CTA CTC GCT CAT CTG GGT 

GAGGARAAAAVALLAHLG 
ALAALGLLLLWRYSLIWV 
RWRRSGCCCCGATRSSGS 
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SRGPAAAAGPPRRPPTH. 
PDVQPQQQGRLGGPRRI H 
PI *RPSSSGGSAAPAAYT 



GCC CTA GAT GGA CCC CGA CGA CGA CGG GGG CCT CCG GCG GCC COG CCG CAT ACA 
35649 35658 35667 35676 35685 35694 

CGG GAT CTA CCT GGG GCT GCT GCT GCC CCC GGA GGC CGC CGG GGC GGC GTA TGT 

RDLPGAAAAPGGRRGGVC 
GIYLGLLLPPEAAGAAYV 
GSTWGCCCPRRPPGR R MC 

AAARSSAPSCRRRAPSS/ 
RQQ.GQRHQRVGEDR RLLH 
GSSGKVI SAFVKTEGSFI 

CGG CGA CGA CGG GAA CTG CTA CGA CCG CTT GTG GAA GCA GAG CGG CCT CTT CTA 
35703 35712 35721 35730 35739 35748 

GCC GCT GCT GCC CTT GAC GAT GCT GGC GAA CAC CTT CGT CTC GCC GGA GAA GAT 

AAAALDDAGEHLRLAGED 
. PLLPLTMLANTFVSPEKM 
ylft RCCP*RCWR TPSSRRRRC 

RSAPCWRPTSGATRWPTI 
G APQAGDRLPVRQGGRHG 
GPQSPVMASHFGSDEV TD 

CGG GCC GAC CGA CCC GTG GTA GCG CCT CAC CTT GGG CGA CAG GAG GTG CCA CAG 
35757 35766 35775 35784 35793 35802 

GCC CGG CTG GCT GGG CAC CAT CGC GGA GTG GAA CCC GCT GTC CTC CAC GGT GTC 

ARLAGHHRGVEPAVLHGV 
PGWLGTIAEWNPLSSTVS 
PAGWAPSRSGTR CPPRCP 



RGPATRCDP R*PRSRPRR 
GAPLQEAIRADRAAGPDG 
;^^||A QRSSNPLGPTVPPEQTA 

GCG GAC GGC CCT CGA CAA GCC GTT AGG CCC GCA GTG CCC GCC GAG GAC CCA GCG 
35811 35820 35829 35838 35847 35856 

CGC CTG CCG GGA GCT GTT CGG CAA TCC GGG CGT CAC GGG CGG CTC CTG GGT CGC 

RLP GAVRQSGRHGRLLGR 
ACRELFGNPGVTGGSWVA 
PAGS CSAIRASRAAPGS P 

ARSRAPRRRAR VAAPARR 
LVRDLQGDGPGYQQQHEE 
SCAISSATAQGTSSSTSK 



GCT CGT GCG CTA GCT CGA CCG GCA GCG 
35865 35874 35883 

CGA GCA CGC GAT CGA GCT GGC CGT CGC 



GAC CGG GCA TGA CGA CGA CCA CGA GAA 
35892 35901 35910 

CTG GCC CGT ACT GCT GCT GGT GCT CTT 
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R^y Av - - r;-- u R-*" • ^^^^^^ 4 A I, 

EHAIELAVAWPVLLLVLF 
S TRSSWPSPGPYCCWCS S 

AATPAGSGSA*GIVVSS P 
HRQRHAAVPREASSWPLL 
TGSDT RR*RVSLRHGRFF 

GCA CGG CGA CAG CCA CGC GGC GAT GGC CTG CGA GTC GGC TAC TGG TGC CTT CTT 
35919 35928 35937 35946 * 35955 35964 

CGT GCC GCT GTC GGT GCG CCG CTA CCG GAC GCT CAG CCG ATG ACC ACG GAA GAA 

RAA V GAPLPDAQP @ T T E E 
VPLSVRR YRTLSR*PRKK 
CRCRCAATGRSADDHGRR 




F G .A I L A S GRAT R S * RVM R 
SV PSSRRVAHRGARGSWA 
PFRRHAGFRTGDPEVPGH 

CCC TTT GGC CGC TAC TCG CGG CTT GGC GCA CGG CAG GCC GAG ATG GCC TGG TAC 
35973 35982 35991 36000 36009 36018 

i^^^GG AAA CCG GCG ATG AGC GCC GAA CCG CGT GCC GTC CGG CTC TAC CGG ACC ATG 

G KPAMSAEPRAVRLYRTM 
GNRR*APNRVPSGSTGPC 
ETGDERRTACR PALPDHA 

R ILSNSSRQRAIDSDPS I 
GS *PIRLVSGPSTATRPS 
AQDPFEFFAAQRHRQGP L 

GCG GAC TAG TCC CTT AAG CTT CTT GCG ACG GAC CGC TAC AGC GAC AGG CCC CTC 
36027 36036 36045 36054 36063 36072 

CGC CTG ATC AGG GAA TTC GAA GAA CGC TGC CTG GCG ATG TCG CTG TCC GGG GAG 

. RLIREFEERCLAMSLSGE 
A*SGN SKN AAWRC RCPGR 
PDQGIRRTL P GDVAVRGD 

^i^^ TPPMWG*MPWSATAAPTQ 
R R R C G G R C R.G P .P P P R R P R 
DDAADV GVDAL LRHGGPD 

TAG CAG CCG CCG TAG GTG GGG ATG TAG CCG GTC CTC CGC CAC CGG CGG CCC CAG 
36081 36090 36099 36108 36117 36126 

ATC GTC GGC GGC ATC CAC CCC TAC ATC GGC CAG GAG GCG GTG GCC GCC GGG GTC 

IVGGIHPYIGQEAVAAGV 
SSAAST PTSARR RWPPGS 
RRRHPP LHRPGGGGRRG L 

AASVSSSTTVLVWRPWPW 
R PA*RRRRR*WCGDRGHG 
ARREGVVVDDGAGMAAMA 



ACG CGC CGC GAG TGG CTG CTG CTG CAG CAG TGG TCG TGG GTA GCG CCG GTA CCG 
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36135' r 36:14-4'" ■ ysrS3 '- : • 36162 - 364 7T 36180 

TGC GCG GCG CTC ACC GAG GAG GAG GTC GTC ACC AGC ACC CAT CGC GGC CAT GGC 



CAALTDDDVVTSTHRGHG 
.ARRSPT TT S SPAP I AAMA 
RGAHRRRRRHQHPSRPWP 

TRALPASGFRISASSHPV 
RGRWPLRGSASAPRATRC 
VDEGLSGVR LPHQGL QAA 

GTG GAG GAG CGG TTC CCT CGG CTG GGC TTC GGC TAG GAG CGG CTC GAG ACG GCG 
36189 36198 36207 36216 36225 36234 

CAC GTC CTC GCG AAG GGA GCG GAC CGG AAG CGG ATG CTG GGC GAG CTG TGC GGC 

HVLAKGADPKRMLAELCG 
TSSPREPTRSGCWPSCAA 
RPRQGSRP EADAGRAVRH 

VAPRFRPRPPEICAASTL 
SRRGSGPGRRSSAR RR R * 
RGGAQVPAAAARHVGGVD 

[GC TGG CGG CGG GAC TTG GCG GCG GCG CGG CGG AGC TAG GTG CGG CGG CTG GAG 




36243 36252 36261 36270 36279 36288 

ACG ACC GGC GGC CTG AAC CGG GGC CGC GGC GGC TGG ATG CAC GCG GCG GAC GTC 

TTAGLNR GRGGSMHAADV 
R P PA * T GAAA AR C T P P T S 
DRRP 'EPGPRRLDAR RRRQ 

^R P T * PALPMTPAPAGMAA 
GRRR HRWRCRPPPRGWRR 
AEADIAGVAD HPRAGG DG 

TCG GAG CCG CAG ATA CCG CGG TTG CCG TAG CAC CCC CGC CCG CGG GGG TAG CGG 
36297 36306 36315 36324 36333 36342 

AGC CTC GGC GTC TAT GGC GGC AAC GGC ATC GTG GGG GCG GGC GCG CCC ATG GCG 

-:;^^S L GVYGANGIVGAGAP I A 
""^P* A S,A S M A P T A S W G R A P P S P 
P R R L W -R Q R H R G .G G R P H R R 

P AAQDNWRRPSPRTATAK 
RHPRTTGAARHRGPPPPR 
GTRGPRELPATV APHRHG 

CGG CCA CGC CGG ACC AGC AAG GTC GCG GCG CCA CTG CCG GCG CAC CGC CAC CGG 
36351 36360 36369 36378 .36387 36396 

GCG GGT GCG .GCC TGG TCG TTC CAG CGG CGC GGT GAG GGC CGG GTG GCG GTG GGC 

AGAAWS FQRRGDGRVAVA 
PVRPGRSSGAVTAGWRW P 
RCGLVVPAAR*RP.GGG GL 

K .PSPASLWPTTSSANLRA 
RRRRHA*GPRPAPPT*GP 
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AAG AAG CCG CTG CCA CGC GAG TCG GTC CCG CAC CAC GAC CTC CGC AAG TTG GAG 
36405 36414 36423 36432 36441 36450 

TTC TTC GGC GAC GGT GCG CTC AGC CAG GGC GTG GTG CTG GAG GCG TTC AAC CTG 

FFGDGALSQGV V L E A F N L 
SSATVRSARAWCWRRSTW 
LRRRCAQPGRGAGGVQP G 

ARHRSGTTNTQSF LP*AV 
PGTAAAPPTRRRSCRSRS 
RGQPP QRHHEDALVV^AVR 

CGC CGG GAC ACC GCC GAC GGC CAC CAC AAG CAG ACG CTC TTG TTG CCG ATG CGC 
36459 36468 36477 36486 36495 36504 

GCG GCC CTG TGG CGG CTG CCG GTG GTG TTC GTC TGC GAG AAC AAC GGC TAC GCG 

AALWRLPVVFVCE NNGYA 
RPCGGCRWCSSARTTATR 
GPVAAAGGVRLREQRL RD 

i^m. LRGSSRASAPSGTSL AAP 
WGAAPGPAPRR.GPPSPPR 
^ ^ G A Q R Q V P R Q G A V .R H L P R G 

TGG TCG GAC GGC GAC CTG GCC CGC GAC CGG CCG CTG GGC CAC CTC TCC CGC CGG 
36513 36522 36531 36540 36549 36558 

ACC AGC CTG CCG CTG GAC CGG GCG CTG GCC GGC GAC CCG GTG GAG AGG GCG GCC 

TSLPLDRALAG DPVERAA 
PACRWTGRWPATRWRG R P 
Q PAAGP GAGRRP GG. E GG R 

NPRVARATSPI SASATA S 
TRGSPARPPR .FPRR RR RR 
P EAQRRARHVSHVGVGDG 

CCC AAG CCG GAC TGC CGC GCG CGC CAC CTG CCT TAC CTG CGG CTG CGG CAG CGG 
-r^^ 36567 36576 36585 36594 36603 36612 

^i^pGG TTC GGC CTG ACG GCG CGC GCG GTG GAC GGA ATG GAC GCC GAC GCC GTC GCC 

G F G L T A R A V D G M D A D A V A 
GSA*RRARWTEWTPTPSP 
VRPDGARGGRNGRRRRR R 

AAASATSRQRRPPPGVKR 
RPR RPRRVSGGPRRDWRG 
VRGGLGDFAAAPAATGGE 

CTG CGC CGG CGG CTC CGG CAG CTT GCG ACG GCG GCC CCG CCG CCA GGG TGG AAG 
36621 36630 36639 36648 36657 36666 

GAC GCG GCC GCC GAG GCC GTC GAA CGC TGC CGC CGG GGC GGC GGT CCC ACC TTC 

DAAAEAVERCRRGGGPTF 
TRPPRP S NAAAGAAVPP S 
RGRRGRRTLPPGRRSHLP 
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SQRV*RNLPWWEKS SCT: 
PSGCR GT*RGGSRRPAPP 
QVAAGVPEVAVVGELLLH 



GAG CTG ACG GCG TGG ATG GCC AAG TTG COG GTG GTG AGG AAG CTC CTC GTC CAC 
36675 36684 36693 36702 36711 36720 

CTG GAG TGG CGC AGO TAG CGG TTC AAC GGC CAC CAC TCC TTC GAG GAG CAG GTG 

LDCRTYRFNGHHSFEEQV 
WTAAPTGSTATTPSR SRW 
GLPHLPVQRPPLLRGAGC 

SF*RSSASTPSHRARSG2 
ASSGPRRRPRRTAHAHGA 
PQVVPVVGLDALPTRTVR 

CGC GAC TTG ATG GCC CTG CTG CGG CTC CAG CCG CTC ACC GCA CGC GCA CTG GGC 
36729 36738. 36747 36756 36765 36774 

GGG CTG AAC TAG CGG GAC GAC GCC GAG GTC GGC GAG TGG CGT GCG CGT GAC CCG 



GLNYRDDAEVGEWRARDP 
— G*TTGTTPRSASGVRVTR 



AELPGRRRGRRVAC A*PJ 

RVWLV. RTSP AVAPAMSAJ 
ACGSCGRPRHSPRRWRRR 
QAG LAGAHVTRRGAGDVG 

GAC GCG TGG GTC TCG TGG GCG CAC CTG CCA CGC TGC CGG CCG CGG TAG CTG CGG 
36783 36792 36801 36810 36819 36828 

CTG CGC ACC CAG AGC ACC CGC GTG GAC GGT GCG ACG GCC GGC GCC ATC GAC GCC 

LRT QS TRVDGATAGAIDA 
CAP RAPAWTVRRPAPS. TP 
AHPEHPRGRCDGRRHRRI 

'VLVS I SSATS NARAPRAC 
SWCASRRPRP TRGRPGPG 
^lH^L GARQDVLGHLEGARAPG 

CTC TGG TCG TGC GAC TAG . CTG CTC CGG CAC CTC AAG CGG GCG CGC CCG GCC CGG 
36837 36846 36855 36864 36873 36882 

GAG ACC AGC ACG CTG ATC GAC GAG GCC GTG GAG TTC GCC CGC GCG GGC CGG GCC 




GGG CTG GGG CGG CTC CGC GAC GTG GTG GAA ATA CGG CTG CCG TGC TGG GGT GCC 
36891 36900 36909 36918 36927 36936 

CGC GAC CCC GCC GAG GCG CTG CAC CAC CTT TAT GCC GAC GGC ACG ACC CCA CGG 
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PTPPRRCTTFMPTARPHG 
RPRRGAAPPLCRRHDPTA 

PTIIQH SCKRVDGRQVLR 
RLSSRIAASAYMVASFWA 
GSHHDSPQVQTC*RASGP 

GGG CCT CAC TAG TAG ACT AGO GAG GTG AAC GCA TGT AGT GGC GCG ACT TGG TCC 
36945 36954 36963 36972 36981 36990 

CCC GGA GTG ATG ATC TGA TGG CTG CAC TTG CGT ACA TCA CCG CGC TGA ACC AGG 

PGVMI* WLHLRTSPR*TR 
PE**SDGCTCVHHRAEPG 
R S D D L AALAYITALNQ A 

Q V V - L H R A VA DADE ALVH 

SCSSIARSSRTQTKPSST 
AARRSPARRGRRRRRRPR 

GCG ACG TGC TGC TCT ACC GCG CGC TGC TGG CGC AGA CGC AGA AGC CGC TCC TGC 
36999 37008 37017 37026 37035 37044 
viiCGC TGC ACG ACG AGA TGG CGC GCG ACG ACC GCG TCT GCG TCT TCG GCG AGG ACG 
- 

'^R /C T T R W R A T T A S A S S A R T 
AARRDGARRPRLRLRRGR 
LHDEMARDDRVCVFGEDV 

P DAEGLDG.LAQVLAEAV S 
RI PRVWTALPRC SR KP S P 
ASRG* GPRWPGARASRRR 

ACG CCT AGC CGG AGT GGG TCC AGC GGT TCC CGG ACG TGC TCG CGA AGC CGC TGC 
37053 37062/ 37071 37080 37089 37098 

TGC GGA TCG GCC TCA CGC AGG TCG CCA AGG GCC TGC ACG AGC GCT TCG GCG ACG 

CGSAS. PRSPRACTSASAT 
ADRPHPGRQGPARALRRR 
RIGLTQVAKGLHERFGDG 




Pi A ' /D D 
'r ,T T 



VGG QRLLGEGAQGGA 
S V G R D S C A K V L R A V P 
^••VRRRCGGTPAPR *WGPWR 

CTG CGC AGC AGC TGT GGG GGG ACA GCC TCG TCC GGA AGT GGT CGG ACC GGT GGC 
37107 37116 37125 37134 37143 37152 

GAC GCG TCG TCG ACA CCC CCC TGT CGG AGC AGG CCT TCA CCA GCC TGG CCA CCG 

D.ASSTPPCRSR'PSPAWPP 
TRRRHPPVGAGLH. QPGHR 
RVVDTPLSEQAFTSLATG 

RRHRPLSRDHLVLDGRQE 
AAIAPCRGTTSYWIGES S 
RP SPPAAViPRPTGSGRAA 



CGC GCC GCT ACC GCC CCG TCG CTG GCC AGC ACC TCA TGG TCT AGG GGA GCG ACG 
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GCG CGG CGA TGG CGG GGC AGC GAG CGG TCG TGG AGT ACQ AGA TOO OCT CGC TGC 



ARRWRGSDRSWSTRSPRC 
RGDGGAATGRGVPDPL AA 
AAMAGQRPVV EYQIPS LL 

IQHELLDGV LRVLERQHG 
*RTNSCIALWACLNESIV 
RDPTRASRWGPACTR ASS 

AGA TAG AGC ACA AGC TCG TCT AGC GGT TGG TCC GCG TGT TCA AGA GCG ACT ACT 
37215 37224 37233 37242 37251 37260 

TCT ATC TGG TGT TCG AGC AGA TCG CCA ACC AGG CGC ACA AGT TCT CGC TGA TGA 

SIWCSSRSPTRRTSSR** 
LSGVRA DRQPGAQV.LADD 
YLVFEQIANQAHKFSLMT 

TPLHLDRDGIQHRAGTR A 

PPCTSTGTV*RTGPEP ER 

RHAPPP GP*RD PAPSRNA 
. U^. . _ . 

^in^C CAC CCG TCC ACC TCC AGG GCC AGT GGA TAG ACC ACG GCC CGA GGC CAA GCG 

37269 37278 37287 37296 37305 37314 

CCG GTG GGC AGG TGG AGG TCC CGG TCA CCT ATC TGG TGC CGG GCT CCG GTT CGC 

PVG RWRSRSPIWCRA PVR 
RWAGG GPGHLS GAGLRFA 
*GG QVEVPVT YLVPGSGS R 

RAHGALVGVMGVA Q E C V D 
EPMAPWCESW.G*LRNACT 
SPC PRGASRGDRCGTRV R 

CGA GCC CGT ACC GGC CGG TCG TGA GGC TGG TAG GGA TGT CGG ACA AGC GTG TGC 
37323 37332 37341 37350 37359 37368 

GCT CGG GCA TGG CCG GCC AGC ACT CCG . ACC ATC CCT ACA GCC TGT TCG CAC ACG 

:,^A RAWPASTPTIPTACSHT 
«§L GHGRPALRPSLQPVRTR 
S .GMAGQHSDHPYSLFAHV 



ADLRDQGGGGR -VGVAQQ E 
PMLVTRG AVAESA*PRS S 
RC* S PGARWRRPRRRG. AA 

AGC CGT AGT TCT GCC AGG ACG GGC GGT GGC GGA GCC TGC GGA TGC CGG ACG ACG 
37377 37386 37395 37404 37413 37422 

TCG GCA TCA AGA CGG TCC TGC CCG CCA CCG CCT CGG' ACG CCT ACG GCC TGC TGC 

SASRRSCPPPPRTPTACC 
RHQDGPARHRLGRLRPAA 
GIKTVLPATASDAYGLLL 

RRDTVRVRHGDERRARQH 
EATRSGSGTATKAGLAS I 
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AGA GCC GCC AGO CAC TGG GCC TGG GCC ACC GGC AGA AGC GCG GCT CGC GCG ACT 
37431 37440 37449 37458 37467 37476 

TCT. CGG CGG TCC GTG ACC CGG ACC CGG TGG CCG TCT TCG CGC CGA GCG CGC TGA 



SRRSVTRTRWPSSRRAR * 
LGGP*PGPG GRLRAERAD 
SAVRDPDPVAVFAPSALM 

ARD LLDGALEARHREPRG 
PVTSS TEPSSPGTGSPDA 
PCPRPPRRRARGPAARTP 

ACC CGT GCC AGC TCC TCC AGA GGC CGC TCG AGC CGG GCC ACG GCG AGC CCA GCC 
37485 37494 37503 37512 37521 37530 

TGG GCA CGG TCG AGG AGG TCT CCG GCG AGC TCG GCC CGG TGC CGC TCG GGT CGG 

WARSRRSPASSARCRSGR 
GHGRGGLRRARPGAARVG 
GTVE EVSGELGPVPLG S A 

P D V A R A L V D G D D G G A L A H 
^P^R IWR VPSSTVTTAVPWH T 
^^^G SGGCPRPR*RRRWRGTR 

GGG CCT AGG TGG CGT GCC CGC TCC TGC AGT GGC AGC AGC GGT GGC CGG TCA CGC 
37539 37548 37557 37566 37575 37584 

CCC GGA TCC ACC GCA CGG GCG AGG ACG TCA CCG TCG TCG CCA CCG GCC AGT GCG 

PGS TARA RTSPS SP PASA 
PDP PHGRGRHR RRHRPVR 
RIHR .TGEDVTVVATGQC.V 

MD GQ G.D R L GHR V L RR D L H 
CTARATASAMASSADI ST 
A ^HRGPRRPPWPPRPTSRP 

ACG TAG AGC GGG ACC GGC AGC GCC TCC GGT ACC GCC TGC TCC GCA GCT AGC TCC 
37593 37602 37611 , 37620 37629 37638 

Ji?kc ATG TCG CCC TGG CCG TCG CGG AGG CCA TGG CGG ACG AGG CGT CGA TCG AGG 

„- .__ 

C M S P W P S R R P W R T R R R S R 
A C R P G R R G G H G G R G V D R G 
HVA LAVAEAMADE A S I E V 

HIRARDVRHVPLR DPRRR 
TSGRVI *GTSQSVIRAD A 
PPDACSRGPPSPSSGPTP 

ACC ACC TAG GCG CGT GCT AGA TGG GCC ACC TGA CCC TCT GCT AGG CCC GCA GCC 
37647 37656 37665 37674 37683 37692 

TGG TGG ATC CGC GCA CGA TCT ACC CGG TGG ACT GGG AGA CGA TCC GGG CGT CGG 

WW I R AR S TRWTGRR S GRR 
GGS.AHDLPGGL GDDPGVG 
VD PRTIYPVDWETIRASA 
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LLGSPQDDDIVGVPHAPE 
SFVPRSTTMSSAL RIH PN 
PS S RVAPR*RHRWGS TRT 

GCC TCT TCT GGC CTG CCG ACC AGC AGT AGC TAG TGC GGT TGG OCT ACA CGC CCA 
37701 37710 37719 37728 37737 37746 

CGG AGA AGA CCG GAC GGC TGG TCG TCA TCG ATG ACG CCA ACC GGA TGT GCG GGT 

RRRPDGWSSSMTPTGCAG 
GEDRTAGRHR*RQPDVRV 
EKTGRLVVIDDANRMCGF 

AALHQGGRRLLEIQRGPG 
PPSTS AVAASCNSR-VARG 
RR RPAPWRPPATRDSPGA 

AGC CGC CGC TCC ACG ACC GGT GGC GCC GCC TCG TCA AGC TAG ACT GCC GGG CCG 
37755 37764 37773 37782 37791 37800 

TCG GCG GCG AGG TGC TGG CCA CCG CGG CGG AGC AGT TCG ATC TGA CGG CCC GGC 

SAARCWPPRRSSSI *RPG 
RRR GAGHRGGAV RSD GPA 
GGEVLA TAAEQFDLTARP 

PPHGPRVARDDGVREH E V 
RR TVR G S PA TMG * A S T S S 
GAPSGAPRRP*GRRARAR 

GGG CCG CCC ACT GGG CCG GCC ^TGC CGC GCC AGT AGG GGA TGC GCG AGC ACG AGC 
37809 37818 37827 37836 37845 37854 

CCC GGC GGG TGA CCC GGC CGG ACG GCG CGG TCA TCC CCT ACG CGC TCG TGC TCG 

P G G * P G R T A R S S P T R S C .S 
PA GDPAGRRGHPLRARAR 
RRVTRPDGAVIPYALVLD 



LRQQRVRGLQGVRDTGDQ 
WANS GSAAWSVSAI RAT R 
GPTAAPRPGASRRSGHRG 



f^TGG TCC GCA ACG ACG GCC TGC GCC GGG TCG ACT GGC. TGC GCT AGG CAC GGC AGG 
37863 37872 37881 37890. 37899 37908 

ACC AGG CGT TGC TGC CGG ACG CGG CCC AGC TGA CCG ACG CGA TCC GTG CCG TCC 

TRRCCRTRPS*PTRSVPS 
PGVAAGRGP ADRRDPCRP 
QALLPDAAQLTDAIRAVL 

LSAARRPGSEF PLSS SNR 
FHRPVVL GQSSRSL LHI G 
STVRCSSARVRVPSFIFE 

ACT TCA CTG CGC CGT GCT GCT CCG GGA CTG AGC TTG CCC TCT CTT CTA CTT AAG 
37917 37926 37935 37944 37953 37962 

TGA AGT GAC GCG GCA CGA CGA GGC CCT GAC TCG AAC GGG AGA GAA GAT GAA TTC 
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EVTRHDEA LTRTGEK (m) N S 
K*RGTTRP*LERERR*IP 



-ADAAPRSS^RRSWRATSA 

LTPRPDHRDGDPGVL QA P 
SRRGRTTVIVTPVLSSHQ 

GCT CGC AGC CGG CGC CCA GCA CTG CTA GTG GCA GCC CTG GTT GCT CGA CAC GAC 
37971 37980 37989 37998 38007 38016 

CGA GCG TCG GCC GCG GGT CGT GAC GAT CAC CGT CGG GAC CAA CGA GCT GTG CTG 

RASAAGRDDHRRDQRAVL 
ERRPRVVTITVGTNELCW 
SVGRGS*RSPSGPTSeA G 

PGTDRSRAPCRCWRS RGP 
QVPTEAGQQV AVGGAEV Q 
SSRHRPEKSSLSVVPKSR 

CGA CCT GGC CAC AGA GCC . GAG GAA CGA CCT GTC GCT GTG GTG GCC GAA GCT GGA 
38025 38034 38043 38052 38061 38070 

. /^CT GGA CCG GTG TCT CGG CTC CTT GCT GGA CAG CGA CAC CAC CGG CTT CGA CCT 

__. _ „_ 

AGPVSRLLAGQRHHRLRP 
LDRC LGSLLDS DTTGFDL 
WTG VSAPCWTATPPASTW 

PRSRRCRSPP RCHRAH AR 
LDAVDVVVRRVATDLM HA 
STQ*T S LS.EASPLTSCTR 

CCT CCA GAC GAT GCA GCT GTT GCT GAG CCG CCT GCC GTC ACA GCT CGT ACA CGC 
38079 38088 38097 38106 38115 38124 

GGA GGT CTG CTA CGT CGA CAA CGA CTC GGC GGA CGG CAG TGT CGA GCA TGT GCG 

GGLL RR QRLGGRQCRAC A 
EVCYVDNDSADGSVEHVR 
RSATSTTTRRTAVSSMCA 

SRARPSS*GCRGCDPSRR 

R G P G- R H.. R .-D - D- A - V - V -- A-^ - I- Q -^-A E G 

A V Q G A T V I M R L S R L R P K A 

GCG CTG GAC CGG GCG CCA CTG CTA GTA GGC GTT GCT GGC GTT AGA CCC GAA GCG 
38133 38142 38151 38160 38169 38178 

CGC GAC CTG GCC CGC GGT GAC GAT CAT CCG CAA CGA CCG CAA TCT GGG CTT CGC 

RDLARGDDHPQRPQ SGLR 
ATW PAVTIIRND RNLGFA 
RPGPR*RSSATTAIWASP 

PSCRRCGGRGPTRRP SRT 
PR VVDADA. AGQLGARVVH 
PAFLTPMRRARS DPAS ★t 



GCC CCG CTT GTT GCA GCC GTA GGC GGC GCG GGA CCT CAG GCC GCG CCT GAT. GCA 
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SSTBT 35196 — 38205 * 382r4 382-23^ 38232 

CGG GGC GAA CAA CGT CGG CAT CCG CCG CGC CCT GGA GTC CGG CGC GGA CTA CGT 



RGE QRRHPPRPGVRRGLR 
.GANNVGIRRALESGA DYV 
GRTTSASAAPWSPARTTC 

GR* GR CR S AAR GP AR V * I 
EEDVGVGPRRGVQHASEG 
NRTLGSVQVGGSRTRPSV 

CAA GGA GCA GTT GGG GCT GTG GAC CTG CGG C6G GOT GGA CCA CGC GCC TGA GTG 
38241 38250 38259 38268 38277 38286 

GTT CCT CGT CAA CCC CGA CAC CTG GAC GCC GCC CGA CCT GGT GCG CGG ACT CAC 

VPRQPRHL DAARPGARTH 
FLVNPDTWT PPDLVRGLT 
SSSTPTPGRRPTWC ADS] 

VPRP .I APTRCRRGAATGi 
FQGLFPRLVADDARQL V A 
S S A S S H GS YPMT P G S C YR 

J^gl^CT TGA CCG GCT CCT TAC CGG CCT CAT GCC GTA GCA GCC GGG CGA CGT CAT GGC 
38295 38304 38313 38322 38331 38340 

CGA ACT GGC CGA GGA ATG GCC GGA GTA CGG CAT CGT CGG CCC GCT GCA GTA CCG 

RTGRGMAGVRHRRPAAVP 
E LAEEWPEYGIVGPLQ YR 
NWPRNGRSTA SSARCS .Ti 

RGRSWPARRT*RT SA C PC 
VVGVGRREVLEVLPRVRG 
*SGSEVASSSNLSHVCVA 

GAT GCT GGG GCT GAG GTG CCG CGA GCT GCT CAA GTT GCT CAC CTG CGT GTG CCG 
38349 38358 38367 38376 38385 38394 

CTA CGA CCC CGA CTC CAC GGC GCT CGA CGA GTT CAA CGA GTG GAC GCA CAC GGC 

RPRLHGARRVQRVDAHG 
YDPDSTALDEFNEWTHTA 
^ T T P T P R R S T S ..S T S . G R T R I 

TAPRAARRRRRRSRGDRC 
QPQAL LVGEGAVPDGMGG 
RHS PSCCAKAPSPIAWGE 

GGA CAC CGA CCC GCT CGT CGT GCG GAA GCG GCC GCT GCC CTA GCG GGT AGG GAG 
38403 38412 38421 38430 38439 38448 

CCT GTG GCT GGG CGA GCA GCA CGC CTT CGC CGG CGA CGG GAT CGC CCA TCC CTC 

PV AGRAARLRRRRDRPSL 
LWLGEQHAFAGDGIAHPS 
CGWASSTPSPATGSPIPI 

PPAASPAPGVSAPARRHii 
RRPQRL'PPGWPRQLVGIH 
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GGG CCG CCC CGA CGG CTT CCC CGC CCG GGG TGC CTG CGA CCT CGT GCG GAT ACA 
38457 38466 38475 38484 38493 38502 

CCC GGC GGG GCT GCC GAA GGG GCG GGC CCC ACG GAC GCT GGA GCA CGC CTA TGT 



PGGAAEGAGPTDAGARLC 
PAGLPKGRAPRTLEHAYV 
RRGCRRGGPHGRWSTPMC 

PNPARRGSRSAARSRAAI 
LTRREEGPGRHQALDPQE 
CP E A S KARV A I S R S I P S S 

CGT CCC AAG CCG CGA GAA GCG GGC CTG GCG CTA CGA CGC GCT CTA GCC CGA CGA 
38511 38520 38529 38538 38547 38556 

GCA GGG TTC GGC GCT CTT CGC CCG GAC CGC GAT GCT GCG CGA GAT CGG GCT GCT 

AGFGALRPDRDAARDRAA 
Q G S A L F A R T AM L R E I G L L 
RVRRSSPGPRCCA RSG CJ 



PAA CRSRPSRGTG GPGi 
^ LHQV GVV LLGVQAAPGA 
*^SSTSCV**SSVSRHRRAR 

GCT GCT CCA CGA CGT GTG GAT GAT GCT CCT CTG GCT GGA CAC GGC GGC CCG GGC 
38565 38574 38583 38592 38601 38610 

CGA CGA GGT GCT GCA CAC CTA CTA CGA GGA GAC CGA CCT GTG CCG CCG GGC CCG 

RRGAAHLLRGDRPVPPGP 
DEVLHTYYEE TDLCRRAR 
TRCCTPTTRRPTCAAGP 2 

PPSAPPGAGPGPCGAGPI 
P R A P P H G Q V Q V Q A D L V P A 
Q.A P Q R T A R C R S R P M W C R P 

GAC CCG CCC GAC CGC CCA CCG GGA CGT GGA CCT GGA CCC GTA GGT CGT GGC CCC 
^J^i 38619 38628 38637 38646 38655 38664 

IpTG GGC GGG CTG GCG GGT GGC CCT GCA CCT GGA CCT GGG CAT CCA GCA GCG GGG 

L G G L A G G P A P G P G H P A P G 
WAGWRVALHLDLGI QHRG 
G R A G G W *P C T WT W A S S T G / 

RRPSRPWCTCGP GCAACC 
AAPRG. HGARVAPDVHPAV 
PPPAVTALVYLRTWMRRL 

GCC GCC GCC CCG CTG GCA CCG GTC GTG CAT GTC GGC CCA GGT GTA CGC CGC GTT 
38673 38682 38691 38700 38709 38718 

CGG CGG CGG GGC GAC CGT GGC CAG CAC GTA CAG CCG GGT CCA CAT GCG GCG CAA 

RR.RGDRGQHVQPGPHAA Q 
GGGAT VASTYSRVHMRR N 
AAGRPWPARTAGSTCGA1 
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SSSGR*RRRSAGPSPRGA 
AVVVEEGVDVPVRRLGGP 
R***RKVS TSQCGAFAAR 



GGC GAT GAT GAT GGA GAA GTG GCT GCA GOT GAG CGT GGG CCG CTT CCG GCG GGC 
38727 38736 38745 38754 38763 38772 

CCG CTA CTA CTA CCT CTT CAC CGA CGT CGA CTG GCA CCC GGC GAA GGC CGC CCG 

PLLLPLHRRRLAPGEGRP 
RYYYLFTDVDWHPAKA A R 
ATTTSS PTSTGTRRRPPG 

RRASARPPG*PGCRRRGR 
EGPAP.EH RVEH AAADDAA 
SAPRQSTA SRMPRLTTPR 

CGA GCG GCC CGC GAC CGA GCA CCG CCT GGA GTA CCC GGC GTC GCA GCA GCG GGC 
38781 38790 38799 38808 38817 38826 

GCT CGC CGG GCG CTG GCT CGT GGC GGA CCT CAT GGG CCG CAG . CGT CGT CGG CCG 

ARR ALARGGPHGPQR RRP 
L A G R W L V A D L M G R S V V G R 
W S p G A G S W R T SW A A A S S A A 

GPRSRLAPSWRPA ASARR 
DRGRGSRPLGDLRQAPEG 
TG AAVPARSVMS AS RQ SA 

GCA GGG CCG GCG CTG GCC TCG CGC CCT CTG GTA GCT CCG CGA CGC GAC CGA GCG 
38835 38844 38853 38862 .38871 38880 

CGT CCC GGC CGC GAC CGG AGC GCG GGA GAC CAT CGA GGC GCT GCG CTG GCT CGC 

RPGRDRSAGDHRGAALA R 
VPAATGARETIEALRWLA 
SRPRPERGRPSRRCAGSP 

GPASWATGGGPGGRAARE 
VP HR GH P GAAPV VA R QA S 
-^SRTGVMRDRRRSWRASRA 



GCT GGC CCA CGG CTG GTA CGC CAG GGC GGC GGC CCT GGT GGC GCG CGA CGC GCG 
38889 38898 38907 38916 38925 38934 

CGA CCG GGT GCC GAC CAT GCG GTC CCG CCG CCG GGA CCA CCG CGC GCT GCG CGC 

RPGADHAVPPPGPPRAAR 
DRVP TMRSRRRDHRALRA 
•TGCRPCGPAAGT TA RCA. L 

RRARRPSP PTR I LGNFTA 
AAPAARRLPRGS SATSPP 
RPPRPAAFPADQHPRQLH 



AGC GCC GCC CGC GCC GCG CCG CTT CCC 
38943 38952 38961 

TCG CGG CGG GCG CGG CGC GGC GAA GGG 



CCG CAG GAC TAC TCC GGC AAC TTC CAC 
38970 38979 38988 

GGC GTC CTG ATG AGG CCG TTG AAG GTG 
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CGC GAC CAG TTG TAG GGC GAG GCC GAG GGC CCC TCG CTA CGG ACC TAG AGG CAT 
38997 39006 39015 39024 39033 39042 

GCG CTG GTC AAC ATC COG CTG CGG GTC CCG GGG AGC GAT GCC TGG ATC TCC GTA 

ALVNIPLRVPGSDAWISV 
RWSTSRCGSRGAMPGSPY 
AGQHPAAG PGERCLDLRT 

GCPYPPMWHTTA LR I SP S 
GVPIRRCGTPRRWGSPRA 
GWLSVAADLPDDGVQHVP 

GGG GGT GTC CCT ATG CCG CCG TAG GTC ACC CAG CAG CGG TTG GAC TAG CTG CCC 
39051 39060 39069 39078 39087 39096 

^^CC CCA CAG GGA TAG GGC GGC ATC CAG TGG GTC GTC GCC AAC CTG ATG GAC GGG 



m 



P P Q GY G G I QWVV A N L MD G 
PH RDTAASSGSSPT*WTG 
PTGIRRHPVGRRQPD GRA 

SSSPWSTKRSPAGPLGAP 
APVRGRPRGAPHGPCGPR 
QQFEAVLDE.QQTGRAARG 

GAC GAC CTT GAG CCG GTG CTC CAG AAG GAC GAC CCA CGG GGC CCG TCG GGC CGG 
39105 39114 39123 39132 39141 39150 

CTG CTG GAA CTC GGC CAC GAG GTC TTG CTG CTG GGT GCC CCG GGC AGC CCG GCC 

L' L E L G H E V F L L G A P G S P A 
CWNSATRSSCWVPRA ARP 
AGTRPRGLPAGCPGQPGR 



RGPSVTT GA PSGS S I SRH 
V G P A S R R A P P R A P P S R A T 
S A R P Q G D H R R A L R L L D L P 



CCT GCG GGC CCC GAC TGG CAG CAC GGC CGC CCG CTC GGC CTC CTC TAG CTC GCC 
39159 39168 39177 39186 39195 39204 

GGA CGC CCG GGG CTG ACC GTC GTG CCG GCG GGC GAG CCG GAG GAG ATC GAG CGG 

GR P GL T VVPAGE P E E I E R 
DARG*P SCRRAS RRRSSG 
TPGADRRAGGRAGGDRAV 

SRVASTSTTWSWLPPTMP 
AASRPRRRPGRGCRRH*R 
PQ PGRVDVHDVVVAATDD 



ACC GAC GCC TGG CGC CTG CAG CTG CAC CAG GTG CTG GTG TCG CCG CCA CAG TAG 
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392^3"" 39222^ ' 3'923^--"' - >392^0 ■ ^ 39^49 3^258 

TGG CTG CGG ACC GCG GAG GTC GAG GTG GTC CAC GAG GAG AGC GGG GGT GTC ATC 



WLRTADVDVVHDHSGGVI 
GGGPRT STWSTT TAAVS S 
AADR GRRRG PRPQRRGHR 

GAPSGGPVAKM LECWKVV 
GPRAAAPCRR** SAGS*W 
ARGPQRRAGGEDARVVEG 

GCG GGC CGG CGG GAG GGC GGG GCG TGG CGG AAG TAG TCG AGC GTG GTG AAG TGG 
39267 39276 39285 39294 39303 39312 

GGC GCG GGC GGG CTG CGG CGG GGC ACC GCG TTC ATC AGC TCG CAC CAC TTC ACC 

GPAGLPPGTAFI SSHHFT 
ARP G CR RAPP S S AR T T S P 
PGRAAAGHRLHQLAPLHH 

RGTLGTPQV*LERACRAW 
GAP * GR P SYRCN GPAA R G 
GPR DVGHATGVTGPRLA G 

SjprGG GCG GGC CAG TTG GGG CAC GCG ACA TGG ATG TCA AGG GCC GGC GTC GCG CGG 
39321 39330 39339 39348 39357 39366 

ACC CGG CGG GTC AAG CCC GTG GGC TGT ACC TAG AGT TCG CGG GCG CAG GGC GCC 



TRPVNPVGCTYS SRA QRA 
PGRSTPWAVPTVPGRSAP 
PAGQPRGLYLQFPGAARP 

QPPPSSAGTIGIGTSGAR 
SRPRRRRARSGSGPRGPA 
V A PAAVVRGHDRDRDVRR 

GTG ACG CCC CGG CGG CTG CTG GGC GGG CAC TAG GGC TAG GGC CAG CTG GGC CGC 
39375 39384 39393 . 39402 39411 39420 

CAC TGC GGG GGC GGC GAG GAC GCG CCC GTG ATC CGG ATC GCG GTC GAG CGG GCG 



)l^H CGGGDDAPVIPIPVDPA 
t^TAGAAT TRP * SR SRS T RR 
^ L R G R R -R R A R D P D P G R P G A 



*RDAASWTALSSKRSKMP 
S G TRRP GPPWP P S GAR * P 
AVPGGRVLHGLL VEQEEH 

GCG ATG GCC AGG CGG CGC CTG GTC CAC CGG TTC GTC CTG AAG GAC GAG AAG TAG 
39429 39438 39447 39456 39465 39474 

CGC TAG CGG TGC GCC GGG GAC CAG GTG GGG AAG GAG GAC TTC CTG GTC TTC ATG 

RY R S AA D QVAKE D F L L F M 
ATGPPR TRWPRRTSCS SW 
LPVRRGPGGQGGLPALHG 

RTEGCLPASSAAANACAQ 
APRAACPPAPPPRTRARR 
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P' D' ^"R^ -R^ -* Tr V^ ' ' Q E R V G 



CCC GCC CAG AGC GGC GTG TTC CCC CGC GAG CTC CGC CGG CGC AAG CGC GTG CGG 
39483 39492 39501 39510 39519 39528 

GGG CGG GTG TCG CCG CAC AAG GGG GCG CTG GAG GCG GCC GCG TTC GCG CAC GCC 

GRVS PHKGALEAAAFiAHA 
GGSRRTRGRWRRPRSRTP 
AGLAAQGGAGGGRVRARL 

PRRRTSAPGAQSGSYKSS 
RGAGPAPRARRPAPTSRR 
AAPAQHQGPGGPLRLVEV 

ACG CCG GCC GCG GAC CAC GAC CGG CCC GGG CGG ACC CTC GGC CTC ATG AAG CTG 
39537 39546 39555 39564 39573 39582 

TGC GGC CGG CGC CTG GTG CTG GCC GGG CCC GCC TGG GAG CCG GAG TAG TTC GAC 

CGRRLVLAGPAWE P EYFD 
AAGAWCWPGPPGSRSTST 
RPAPGAGRARL GAGVL RR 

^ ^ , I V R R Y P E V T S G I P S T P P S 
S*EGTRS SRRA.SRHPPRR 
LDSAPVA RGDLRDTLHAA 

CTC TAG TGA GCG GCC ATG CCG AGC TGG CAG CTC GGC. TAG CCA CTC CAC CCG CCG 
39591 39600 39609 39618 39627 39636 

GAG ATG ACT CGC CGG TAG GGC TCG ACC GTG GAG CCG ATG GGT GAG GTG GGC GGC 

EITRRYGSTVEPI GEVGG 
RS LA GTARPSSRSVRWAA 
DHSPVRLDRRADR *GGRR 

R'RS SR SAEACA T S AMDWA 
AAARGARRRVRPAPWTGP 
LPPEVQ,EGGCVRHQGHGL 

^' CTC GCC GCC GAG CTG GAC GAG CGG AGG CGT GTG CGC CAC GAC CGG TAG AGG GTC 
'^-''V-j^ 39645 39654 39663 39672 39681 39690 

^^AG CGG CGG CTC GAC CTG CTC GCC TCG GCA CAC GCG GTG CTG GCC ATG TCC CAG 

E RRLDL LASAHAVLAMSQ 
SGGSTCSPPHTRCWPCPR 
AAARPA R LRTRG AGHVPG 

TV PGHPPMQHSGPAVTT E 
P*RATPRCRTRAPHSPPR 
R DG PRPAADPALRTRRHD 

CGC CAG TGG CCC GGC ACC CCG CCG TAG ACC ACG CTC GGC CCA CGC TGC CAC CAG 
39699 39708 39717 39726 39735 39744 

GCG GTC ACC GGG CCG TGG GGC GGC ATC TGG TGC GAG CCG GGT GCG ACG GTG GTC 

AVTGPWGGIWCEPGATVV 
RSPGRGAASGASRVRRWS 
GHRAVGRHLVRAGCDGGL 

- 155- 



SAATLPVGTTPVPLPQRA 
RPRRSRCERRPCPCRSGP 
GLGGH AASGDHARAVAAQ 

AGG CTC CGG CGG CAC TCG CCG TGA GGG GAG CAC COG TGC CCG TTG CCG ACG GAG 
39753 39762 39771 39780 39789 39798 

TGC GAG GCC GCC GTG AGO GGC ACT CCG GTC GTG GGC ACG GGC AAC GGC TGC CTG 

SEAAVSGTPVVGTGNGCL 
PRPP*AALPSWARATAAW 
RGRRE. RHSRRGHGQRLPG 

SITGETPSTTP YPVSKAG 
RSRARPRRLRPI RCRSRA 
GLDHGRDAFDHSVAGVER 

CGG CTC TAG CAC GGG AGC GAG CCG CTT GAG CAC CCT ATG CCG TGG CTG AAG GGC 
39807 39816 39825 39834 39843 39852 

GCC GAG ATC GTG GCC TCG GTC GGC GAA GTC GTG GGA TAG GGC ACC GAC TTC GCG 

AEIVPSVGEVVGYGTDFA 
PRSCPRSAKSWDTAPTSR 
M^l RDRALGRRSRGIRHRLRA 

S SARRVRAP SGAD S S TR R 
RR LVGSGPLAAPMRRPGA 
GVFCA P GQCPQRCGVLDP 

GGG CTG CTT CGT GCG GCC TGG GAC CGT CCC GAC GGC CGT AGG CTG CTC CAG GCC 
39861 39870 39879 39888 39897 39906 

CCC GAC GAA GCA CGG CGG ACC CTG GCA GGG CTG CCG GGA TCG GAC GAG GTC CGG 

PDEARRTLAGLPASDEVR 
PTKHA .GPWQGCRHPTRS G 
RRSTPDPG RAAGIRRGPA 

AATRNHPWTV IASRYTS C 
HPPGTTPGHSSRRVTHPA 

<^TRRDPQPAMHRDGFPIHL 

_ 

*^GCA GGC CGC GAG GCC AAC ACC CCG GTA CAC TGC TAG CGG CTT GCC ATA CAC CTC 
39915 39924 39933 39942 39951 39960 

CGT GCG GCG GTC CGG TTG TGG GGC CAT GTG ACG ATC GCC GAA CGG TAT GTG GAG 



RAAVRLWGHVTIAERYVE 
VRRS GC GAM*RSPNGM W S 
CGGPVVGPCDDRRTV CGA 

YRLS SAPAVQF -HPASARL 
TGCA APRLSRSTLPRPGS 
LVAPQQGSRGPLSPGLGP 

GTC ATG GCG TGC GAC GAC CGG CCT CGC TGG ACC TTC ACT CCC CGG CTC CGG GCC 
39969 39978 39987 39996 40005 40014 

CAG TAG CGC AGG CTG CTG GCC GGA GCG ACC TGG AAG TGA GGG GCC GAG GCC CGG 
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STAGC. WPERPGSE GPRPG 
VPQAAGRSDLEVRGRGPE 

.PHVARAEARR*DKDLWPR 

RTSRGPRPVDDTRTWGPA 
APPGGPGRCTTLGQGALP 

TCG CCC ACC TGG CGG GCC CGG AGC CGT GCA GCA GTC AGG AAC AGG TCG GTC CCC 
40023 40032 40041 40050 40059 40068 

AGC GGG TGG ACC GCC CGG GCC TCG GCA CGT CGT CAG TCC TTG TCC AGC CAG GGG 

SGWTARASARRQSLSSQG 
AGGPPGPRHVVSPCPARG 
RVDRPGLGTSSVLVQ PGA 

PEPDAVEEAAGMFVLVYA 
RSPTPSRKPRGWSSWCMP 
AAR PRR GRRGGGHLGACL 

GCG CCG AGC CCC AGC CGC TGG AGA AGC CGG CGG GGG TAC TTC TGG TCG TGT ATC 
40077 40086 40095 40104 401.13 40122 

. CGC GGC TCG GGG TCG GCG ACC TCT TCG GCC GCC CCC ATG AAG ACC AGC ACA TAG 

RGSGSATSSA .APMKTST* 
AAR GRRPLRPPP *RPAHR 
RLGVGD LFGRPHEDQHI G 

RRTQDTLNPGAYHPARLA 
GAR R T P S I PAR T I R L A C P 
GPADPRHSQPGR LASRAP 

CGG GCC GCG CAG ACC AGC CAC TCT AAC CCC GGG CGC ATT ACG CCT CGC GCG TCC 
40131 40140 40149 40158 40167 40176 

GCC CGG CGC GTC TGG TCG GTG AGA TTG GGG CCC GCG TAA TGC GGA GCG CGC AGG 

ARRVWS VRLGPA * C GA R R 
PGASGR *DWGPRNAERAG 
PARLVGEIGARVMRSAQG 

f)HVVAEGSALPVPVGAAPD 
^ T C W P R V R P S P S P C G P P R T. 
R A GRG * G LRPPRAGR RGP 

CGC ACG TGG TGC CGG AGT GGG CTC CGC TCC CCC TGC CCG TGG GGC CGC CGG CCC 
40185 40194 40203 40212 40221 40230 

GCG TGC ACC ACG GCC TCA CCC GAG GCG AGG GGG ACG GGC ACC CCG GCG GCC GGG 

ACTTAS PEARGTGTPAAG 
RAPRPHPRRGGR APRRPG 
VHHGLTRGEGD GHPGGRV 

VADTVLGR IRDDDD I HRH 
WRTP*WGGSVTTTTSTGT 
GGRRDGAGPYP RRRR HAP 



AGG TGG CGC AGC CAG TGG TCG GGG GCC TAT GCC AGC AGC AGC AGC TAC ACG GCC 
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4a2'39^^^ 4a24S '' 402 5T ' ' 402'6S^* ^ ' - 40275 40284 

TCC ACC GCG TCG GTC ACC AGC CCC COG ATA CGG TCG TCG TCG TCG ATG TGC CGG 



STASVTSPRIRSSSSMCR 
• PPRRSPAPGYGRRRRCAG 
HRV .GHQPPDTVVVVDVP> 

PLVPGLHAGPVYHLCGSI 
RCCPVSTRAPCMTCAAAT 
AAARSRPARRACLAPLRQ 

ACG CCG TCG TGC CCT GGC TCC ACG CGC GGC CCG TGT ATC ACG TCC GTC GGC GAC 
40293 40302 40311 40320 40329 40338 

TGC GGC AGC ACG GGA CCG AGG TGC GCG CCG GGC ACA TAG TGC AGG CAG CCG CTG 

CGSTGPRCAPGT*CRQPL 
AAA R D R GARRAH S A G S R C 
R QHGTEVRAGHIVQAAAT 

VTAEDLPTWISLGRRRCI 
WPPRTWRPGYASGAGAAA 
G RHG RGAPDMHQARAPPL 

^ ;^ -^i lio ico -cic -co oi; ;;c o.c tcc ^ 

40347 40356 40365 40374 40383 40392 

TCC ACG GTG GCC TCG TCC AGC GGG GTC CAT ATG CTG AGC CCG CGC CGG CGG CAG 

STVA SS SGVHMLSPRR RQ 
PRWPRPAG S IC*ARAG GS 
HGGL VQRGPYA EPAPAA i 

PDMYGEDQHWPTAAGYNl 
RTWTARTRTGPRQRATTR 
APGHLGRGPALANGRRLE 

GCG CCC AGG TAC ATC GGG AGC AGG ACC ACG GTC CCG CAA CGG CGC GGC ATC AAG 
40401 40410 40419 40428 40437 40446 

CGC GGG TCC ATG TAG CCC TCG TCC TGG TGC CAG GGC GTT GCC GCG CCG TAG TTC 

iJpRGSM*PSSWCQGVAAP*F 
ij^ AGPCS PRPGARALPRR S S 
R V H V A L V -L V P G R C R A V V I 

PKLIAH GYF DLEDEPIDI 
RS*FPTGMSTSSTRRSTW 
AAESHRAWLLRARG GPHG 

CCG CCG AAG TCT TAC CGC ACG GGT ATC TTC AGC TCG AGC AGG AGG CCC TAC AGG 
40455 40464 40473 40482 40491 40500 

GGC GGC TTC AGA ATG GCG TGC CCA TAG AAG TCG AGC TCG TCC TCC GGG ATG TCC 

GGFRMACP*KSS SSSGMS 
AAS EWRAHRSR ARP'P GC P 
RLQNGVPIEVELVLRDVC 

LQAA I ARCRQFHA S E VL E 
CSRPSRGAGSSIRVRSWS 
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TCG TCG ACG CGC CGC TAG CGG GCC GTG GCG ACC TTT ACG CGT GAG AGC TGG TCG 
40509 40518 40527 40536 40545 40554 

AGC AGC TGC GCG GCG ATC GCC CGG CAC CGC TGG AAA TGC GCA CTC TCG ACC AGC 



SSCAAIARHR WKCALSTS 
AAARRSPGTAGNAHSR PA 
QLRGDRPAPLEMR TLDQL 

PV FKEPRVIQPLRAPRDS 
PS SNRRACSRRYGPRGT P 
RPRI EG PARDATAPGAQR 

AGC CCC TGC TTA AAG AGG CCC GCG TGC TAG ACG CCA TCG GCC CGG CCG GAC AGC 
40563 40572 40581 40590 40599 40608 

TCG GGG ACG AAT TTC TCC GGG CGC ACG ATC TGC GGT AGC CGG GCC GGC CTG TCG 

SGTNFSGRTICGSRAGLS 
RGRI SP GARSAVAGPACR 
GDE FLRAHDLR * P GRP V G 

vi DQRGAIDFYDGTTFDAHE 
4(N IRAAPSTSTTARLSTPT S 
FGPPRRHRLLRGYHLRRA 

CTT AGG ACC GCC GGC CGC TAC AGC TTC ATC AGC GGG CAT CAC TTC AGC CGC ACG 
40617 40626 40635 40644 40653 40662 

gaa tcc tgg cgg ccg gcg atg tcg aag tag tcg ccc gta gtg aag tcg gcg tgc 

eswrpamsk* spvvksac 
npggrrcrssrp**srr'a 
ilaagdvevvar sevgvl 

SFLRDYVGRLWE LETDD V 
PSCAITSVACGSWSRT TW 
RLVP SRLCRAAVGAGHRG 

AGC CTC TTG TCC GCT AGC ATC TGT GGC GCG TCG GTG AGG TCG AGG CAC AGC AGG 
<J^ 40671 40680 40689 40698 40707 40716 

WTCG GAG AAC AGG CGA TCG TAG ACA CCG CGC AGC CAC TCC AGC TCC GTG TCG TCC 

S E N R R S * T P R S H S S S V S S 
RR TGDRRHR AA T PAP CR P 
GEQAIVDTAQPLQLRVVH 

LRPL SAFGDAQFAARHE E 
SGRC RHSDTPRSPQATSR 
RAAAAI RIRRGPLSRPAG 

TGC TCG GCG CCG TCG CTA CGC TTA GGC AGC CGG ACC TTC CGA CGC GCC ACG AGG 
40725 40734 40743 40752 40761 40770 

ACG AGC CGC GGC AGC GAT GCG AAT CCG TCG GCC TGG AAG GCT GCG CGG TGC TCC 

TSRGSDANPSAWKAARCS 
RAAAAMRIRRPGRLRGAP 
EPRQRCESVGLEGCAVLL 
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DIVTEVAGMRRSREDP (m) C 
TS*LKWPGWVAAGKTLCK 
RRDCNGRGGYPPEKR*AN 

AGC AGC TAG TGT CAA AGG TGC CGG GGG TAT GCC GCC GAG GAA AGO AGT CCG TAA 
. 40779 40788 40797 40806 40815 40824 

TCG TCG ATC ACA GTT TCC ACG GCC CCC ATA CGG CGG CTC CTT TCG TCA GGC ATT 

SSITVSTA .PIR RLLSSGI 
RR S .QFPRPPYGGSFRQAF 
VDHSFHGPHTAAPFVRHl 

PSRYTGGRFIADAKAPST 
LHVIREEGSYPMPKLRLI 
STFSVNRGPIHCRS*GSF 

ACT CCA CTT GCT ATG CAA GGA GGG GCC TTA TAC CGT AGC CGA AAT CGG CCT CTT 
40833 40842 40851 40860 40869 40878 

TGA GGT GAA CGA TAC GTT CCT CCC CGG AAT ATG GCA TCG GCT TTA GCC GGA GAA 

*GERYVPPRNMASALAGE 
. iEVNDTFLPGIWHRL*PEN 
41^ R*TIRSSPEYGIGFSRR] 

HIS*VRAPLPSDMATPRI 
TFQSSEQRYRHIWPRRA^A 
L S NV L S K G TAT F GH G D P P 

ATC ACT TAA CTG ATC TGA GAA CGG CCA TCG CCA CTT AGG TAC CGG CAG CCC GCC 
40887 40896 40905 40914 40923 40932 

TAG TGA ATT GAC TAG ACT CTT GCC GGT AGC GGT GAA TCC ATG GCC GTC GGG CGG 

**ID*TLAGSGESM AVGR 
SELTRL LPV AVNPWP SG G 
VN*LDSCR*R* IHG RR Ai 

EWQ. HAHLVR.PAVYTFYPI 
SGNIR TYYERRSTHL IRS 
^AGMSAR T I SEARR I Y FVP 

^^GCG AGG GTA ACT ACG CGC ACA TTA TGA GAG CCG CGC TGC. ATA CAT TTT ATG CCC 
40941 40950 40959 .40968 40977 40986 

CGC TCC CAT TGA TGC GCG TGT AAT ACT. CTC GGC GCG ACG TAT GTA AAA TAC GGG 



R SH*CACNTLGATYVKYG 
APIDA .RVILSARRM*NTG 
LPLMRV*YSRRDVCKIRi 

PN S H S S VTRNRQ I 'D S A D I 
RTAIVPCLAIAN STPPTM 
APQ*SQVCHSQTPHRLR* 



TCG CCC AAC 
40995 
AGC GGG TTG 



GAT ACT GAC 
41 004 
CTA TGA CTG 



CTG TGT CAC 
41013 
GAC ACA GTG 



GCT AAC GCA 
41022 
CGA TTG CGT 



ACC TAC AGC 
41031 
TGG ATG TCG 



CTC CGC AGT 
41040 
GAG GCG TCA 
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A G C DWTQCDC VGCRRRH 
R V A TGHSAIA LDVGGVI 
— 

VVVLREFQSPKLPGEVKR 
**SSGKSSAQS*PVKSRA 
RSRR AKRVPKAEPSRRGQ 

AGA TGA TGC TGC TCG GAA AGC TTG ACC GAA CCG AAG TCC CCT GGA AGC TGG AAC 
41049 41058 41067 41076 41085 41094 

TCT ACT 'ACG ACG AGC CTT TCG AAC TGG CTT GGC TTC AGG GGA CCT TCG ACC TTG 

STTTSL SNWLGFRGPSTL 
LLRRAFRTGLASGDLRPC 
YYDEPFELAWLQG- TFDLA 

DGSIRTNGEAIEDLVGLT 
TVAS GLTVRRSKMS SVSR 
P*RQDSH*GGRN*RPCRA 

GCC AGT GGC GAC TAG GCT CAC AAT GGG AGG CGC TAA AGT AGC TCC TGT GJGC TCG 
41103 41112 41121 41130 41139 41148 

^^CGG TCA CCG CTG ATC CGA GTG TTA CCC TCC GCG ATT TCA TCG AGG ACA CCG AGC 

^ 

RSPLIRVLPSAISSRTPS 
GHR* SECYPPRF HRGHRA 
VTADPSVTL RDFI EDTER 

EIQVPFR RRLSRANERRC 
K*RSPFVGASRGPMREE A 
NRDPRS FAPPAVPCERKP 

CAA AGA TAG ACC TGC CCT TTT GCG GCC GCC TCG CTG GCC CGT AAG AGA GAA GCC 
41157 41166 41175 41184 41193 41202 

GTT TCT ATC TGG ACG GGA AAA CGC CGG CGG AGC GAC CGG GCA TTC TCT CTT CGG 

VSIWTGKRRRSDRAF SLR 
FLSGRENAGGATG HSLFG 
FYLDGKTPAERPGILSSA 

RGVLAPDPNSPGPPFQGL 
'"'^ A A S S L Q _ T R T . R R A Q R S - S A - W 
LP RRSSP GPEVPRAPVPG 

GTC GCC GGC TGC TCT CGA CCC AGG CCC AAG CTG CCC GGA CCG CCC TTG ACC GGG 
41211 41220 41229 41238 41247 41256 

CAG CGG CCG ACG AGA GCT GGG TCC GGG TTC GAC GGG CCT GGC GGG AAC TGG CCC 

QRPTRAGSGFDGPGGNWP 
SGRREL GPGST G LAGTGP 
AADESWVRVRRAWRELAQ 

LNRT RNRRDRGEGAFHRR 
SIGPEIAATVARARSIGV 
PSEQNSQPP*PGRGRFAS 



TCC TCT AAG GAC CAA GCT AAC GCC GCC AGT GCC GGG AGC GGG CGC TTT ACG GCT 
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4V265^-— 4r2T4U'v.-= . 41283^ ' 41292- ' - 4r30r • - 413T0 

AGG AGA TTC CTG GTT CGA TTG CGG CGG TCA CGG CCC TCG CCC GCG AAA TGC CGA 



RRFLVRLRRSRPSPAKCR 
.GDSWFDCGGHGPRPRNAD 
EIPGS lAAVTALAREMPT 

RHDRIL RGLAGVYERFPP 
VTTAF*GGSHASTSASHP 
SPPRSDAAR TRRR VRP IP 

GOT GCC ACC AGC GCT TAG TCG GCG GGC TCA CGC GGC TGC ATG AGC GCC TTA CCC 
41319 41328 41337 41346. 41355 41364 

CGA CGG TGG TCG CGA ATC AGC CGC CCG AGT GCG CCG ACG TAC TCG CGG AAT GGG 

RRWSRI SRPSAPTYSRNG 
DGGRESAARVRRRTRGMG 
TVVANQPPECADVLAEWG 

QGGDQLRHDEVAEFPDGL 
SVATRSVTTRSQKSPT AL 

ASRRGP SPPGRSSRLPRW 

^ 

r^pbcG ACT GGC GGC AGG ACC TCT GCC ACC AGG AGC TGA CGA AGC TTC CCC AGC GGT 
41373 41382 41391 41400 41409 41418 

GGC TGA CCG CCG TCC TGG AGA CGG TGG TCC TCG ACT GCT TCG AAG GGG TCG CCA 

G*P PSWRRWSSTASKGSP 
ADRRPGDGGPRLLRRGR Q 
LTAVLETVVLDCFEGVAK 

GIGPQQADGQGPEAP GGA 
GSGRSSPMARARSPRGGP 
ARDGAAPCRGPGARGAGR 

TCG GGC TAG GGG CCG ACG ACC CGT AGC GGG ACC GGG CCG AGC CGG CCG GGG GGC 
41427 41436 41445 41454 41463 41472 

AGC CCG ATC CCC GGC TGC TGG GCA TCG CCC TGG CCC GGC TCG GCC GGC CCC CCG 

.^S P I P G C WA S PWP G S A G P P 

w 



-^ ARSPAAGHRPGPAR PAPR 
P D. P R L L. G I A L A R L G R P P- G 



LQQHHAVADV VVHCGGTG 
SSSTTPLRTSWSTAGARE 
RAAPPP CGRRGRRPVRGN 

CGC TCG ACG ACC ACC ACC CGT TGG CGC AGC TGG TGC TGC ACC GTG GGC GGG CAA 
41481 41490 41499 41508 41517 41526 

GCG AGC TGC TGG TGG TGG GCA ACC GCG TCG ACC ACG' ACG TGG CAC CCG CCC GTT 

ASCWWWATASTTTWHPPV 
RAAGGGQPRRPRRGTRPF 
E L LVVGNRVDHDVAPARS 

QAARRHEYQRLVAVAPWR 
RPQG ATNTSGSSP*RLGG 
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GGG ACC CGA CGG GCC GCC ACA AGO ATG ACG GCC TCC TGC CGA TGG CGT CCG GTG 
41535 41544 41553 41562 41571 41580 

CCC TGG GCT GCC CGG CGG TGT TCG TAC TGC CGG AGG ACG GCT ACC GCA GGC CAC 



PWAAR RCSYCRRTATAGH 
PGLPGGVRTAGGRLPQAT 
LGCPAVFVLPEDGYRRPP 



ADMRVEGPGVAGQARDT G 
PTWGSRVRA* RARRATRV 
PRGDPG*GPRGRGARPGY 

GCC CGC AGG TAG GCC TGG AGT GGG CCC GGA TGG CGC GGG ACG CGC GCC AGG CAT 
41589 41598 41607 41616 41625 41634 

CGG GCG TCC ATC CGG ACC TCA CCC GGG CCT ACC GCG CCC TGC GCG CGG TCC GTA 

RASIRT SPGPTAP CARSV 
GRPSGPHPGLPRPARGPY 
GVHPDLTRAYRALRAVR T 

^. ^ H HRRPVVH RPDGGEGVQGR 
.^^J T G G P S S T GRTAE RA S RAA 
*RAEPPRRAAPRRGRRGPR 

GGC ACG GAG GCC CCC TGC TGC ACG GCG CCC AGC GGA GGG AGC GGC TGG ACC GGC 
41643 41652 41661 41670 41679 41688 

CCG TGC CTC CGG GGG ACG ACG TGC CGC GGG TCG CCT CCC TCG CCG ACC TGG CCG 

PCLRGTTCRGSPPSPTWP 
RASGGRRA A GRLPRRPGR 
VPPGDDVP RVASLADLAA 

RGQRAETRQSWPPGAARP 
DGRARRPASHGRRVQQGP 
TAGPAGRHATVVASR SGP 

, GCA GCG GGG ACC GCG CGG AGC CAC GCG ACA CTG GTG CCG CCT GGA CGA CGG GCC 
^ " -^A 41697 41706 41715 41724 41733 41742 

mPGT CGC CCC TGG CGC GCC TCG GTG CGC TGT GAC CAC GGC GGA CCT GCT GCC CGG 



R R P W R A S -V R C. DHGGPAAR 
VAPGAPRCA T T A D L L P G 

SPLARLGAL*PRRTCCPG 

' 

GYPPSRPSPN*RIGASPW 
VTRRHDPRRTE DSGPQRG 
SRVATIPAVPKMPDRSVA 



CCT GGC ATG CCG CCA CTA 
41751 41760 
GGA CCG TAC GGC GGT GAT 



GCC CCG CTG CCC AAA GTA 
41769 41778 
CGG GGC GAC GGG TTT CAT 



GCC TAG GGC CGA CTG CCG 
41787 41796 
CGG ATC CCG GCT GAC GGC 




A*RQRGARAPRR* GPTG. 
PEGSVARARRGGEVPRER 
LSV ASPGRAGAAKLRANG 



GTC CGA GTG GCG ACT GCC GGG CGC GCG CGG CCG GCG GAA GTT GGC CCG CAA GGG 
41805 41814 41823 41832 41841 41850 

CAG GCT CAC CGC TGA CGG CCC GCG CGC GCC GGC CGC CTT CAA CCG GGC GTT CCC 

QAHR*RPARAGRLQPGVP 
RLTADGPRA PAAFNRAFP 
G SP L T A RARRP P S T G R S I 

PPRRGPRGPVPPPRCRR5 
R 'HDAAPGGRSQRLGVDDV 
GTTPPR AAGPSASASMT* 

CGG CCA CCA GCC GCC GGC CCG GCG GGG CCC TGA CCG CCT CCG GCT GTA GCA GAT 
41859 41868 41877 41886 41895 41904 

GCC GGT GGT CGG CGG CCG GGC CGC CCC GGG ACT GGC GGA GGC CGA CAT CGT CTA 

AGG RRPGRPGTGGGRHRL 
^^^ PVVGGRAAPGLAEAD I VY 



RWSAAGPPRDWRRPTSS 



r 



^4 



GPRRG* DP GRR VDARGP3 
E QGGAE TRD EGFTPGVQD 
KRAAPRLGTR ASR RGSRT 

GAA GGA CCG GCG GCC GGA GTC AGG CCA GGA GCG GCT TGC AGC CGG GCT GGA CCA 
41913 41922 41931 41940 41949 41958 

CTT CCT GGC CGC CGG CCT CAG TCC GGT CCT CGC CGA ACG TCG GCC CGA CCT GGT 

LPGRRPQSGPRRTSARP G 
FLAAGL SPVLAER RPDL V 
SWPPASVRSSPNVGPTW 2 

PRV. GVAPRPAPPATWLP^ 
LGFASQQDLHQLRQGSRS 
SASRRSSTSTSSASDLAP 



GCT CCG GCT TGC GGC TGA CGA CCA GCT CCA CGA CCT CCG CGA CAG GTC TCG CCC 
41967 41976 41985 41994 42003 42012 

CGA GGC CGA ACG CCG ACT GCT GGT CGA GGT GCT GGA GGC GCT GTC CAG AGC GGG 

RGRTPTAGRGAGGAVQSG 
EAERRLLVEVLEALSRAG 
RPNADCWSRCWRRCPERI 

GGPTRVPWSPRPPRRARl 
VARHEYQGARAPRDVRGL 
CRGTNTSALEPPAT *AGS 



TGT GGC GGG CCA CAA GCA TGA CCG GTC 
42021 42030 42039 

ACA CCG CCC GGT GTT CGT ACT GGC CAG 



GAG CCC GCC CCG CCA GAT GCG CGG GCT 
42048 42057 42066 

CTC GGG CGG GGC GGT CTA CGC GCC CGA 



- 164- 



HRPVFVLASSGGAVYAPE 
TARCSYWPARAGRSTRPR 

RVATGPSWGS GARSRRRA 
DFRRVPLGARGPGVGDVP 
TSGGYRSVLGVRGSET*P 

CCA GCT TGG CGG CAT GGC CCT CTG GTC GGG CTG GGC CGG GCT GAG GCA GAT GCC 
42075 42084 42093 42102 42111 42120 

GGT CGA ACC GCC GTA CCG GGA GAC CAG CCC GAC CCG GCC CGA CTC CGT CTA CGG 

GRTAVPGD QPDPARLRLR 
VEPPYRETSPTRPDSVYG 
SNRRTGRPARPGPTPSTG 

RWAGGRVRATGASPHRGH 
VGLEAEFALQAPVRIGDT 
CALSRRSRSSHRCES ATR 

CGT GCG GTT CGA GGC GGA GCT TGC GCT CGA CAC GGC CGT GAG CCT ACG GCA GGC 
42129 42138 42147 42156 42165 42174 

vGCA CGC CAA GCT CCG CCT CGA ACG CGA GCT GTG CCG GCA CTC GGA TGC CGT CCG 

p. . 

*ARQAP PRTRAVPALGCRP 
HAKLRLERELCRHSDAVR 
TPSSAS NASCA GTRMPSV 

RPRATSCHR RDR GARGA R 
GH DRPQA IDVTGALAGQA 
ATTA R NL LT*PGPWRARR 

ACG GCA CCA GCG CGC CAA CTC GTT ACA GAT GCC AGG GCC GGT CGC GCG GGA CGC 
42183 42192 42201 42210 42219 42228 

TGC CGT GGT CGC GCG GTT GAG CAA TGT CTA CGG TCC CGG CCA GCG CGC CCT GCG 

CRGRAVEQCLRSRPARPA 
AVVARLS NVYGPGQRALR 
PWSRG* AMSTVPASAPCA 

TRHAAASASPPRGPR .ARA 
PET H Q R V P Q R R G G P . A L. G . H 
P NPT S GCQSVAAARP S GT 

GCC CAA GCC ACA CGA CGG CGT GAC CGA CTG CCG CCG GCG GGC CCC GCT CGG GCA 
42237 42246 42255 42264 42273 42282 

CGG GTT CGG TGT GCT GCC GCA CTG GCT GAC GGC GGC CGC CCG GGG CGA GCC CGT 

RVRCAAALADGGRPGRAR 
GFGVLPHWLTAAARGEPV 
GSVCCRTG*RRPPGASPC 

PTRRDAHPGPSHGRRRR.* 
PHEAIRMHDPVIDVDVVD 
RTNPSGCTTRS*TWTSST 



CGC CCA CAA GCC GCT AGG CGT ACA CCA GGC CCT GAT ACA GGT GCA GCT GCT GCA 

- 165- 



42291^-^ 42300- 42309-^ — 42jrS'^ ^ 423^7 42336 

GCG GGT GTT CGG CGA TCC OCA TGT GGT CCG GGA CTA TGT CCA CGT CGA CGA CGT 



AGVRRSACGPGLCPRRRR 
.RVFGDPHVVRDYVHVDDV 
GCSAIRMWSGTMSTSTTS 

G TGARAARGPR RRGAARI 
GPEQERQAAPDAAAPQGG 
VR.NR S A SRPRTP P P R S GA 

GTG GGC CAA GGA CGA GCG CGA CGC GCC GGC CCA GCC GCC GCC GGC CGA CGG GCG 
42345 42354 42363 42372 42381 42390 

CAC CCG GTT CCT GCT CGC GCT GCG CGG CCG GGT CGG CGG CGG CCG GCT GCC CGC 

HPVPARAARPGRRRPAA R 
TRFLLALRGRVGGG RLPA 
PGSCSRCAAGSAAA GCP] 

P SRR S P R AWKA S R GA P S I 
HHVDARAHGSRQAAQQ LD 
TTFTPEPTGVESLPR.S S I 

JWhCA CCA CTT GCA GCC GAG CCC GCA CGG GTG AAG CGA CTC GCC GGA CGA CCT CTA 
' 42399 42408 42417 42426 42435 42444 

CGT GGT GAA CGT CGG CTC GGG CGT GCC CAC TTC GCT GAG CGG CCT GCT GGA GAT 

RGERRL GRAHFAERP AGD 
VVNVGSGVPTSLSGLLEI 
W*TSA RACPLR*AACWRJ 

TRHSRRSRRPASPAPVT] 
HGTHGAAGDRHAPLPSPG 
TDPTVPPETATRQSRPRD 

GCA CAG GCC ACA CTG GCC GCC GAG GCA GCG CCA CGC GAC CCT CGC CCC TGC CAG 
42453 42462 42471 42480 42489 42498 

CGT GTC CGG TGT GAC CGG CGG CTC CGT CGC GGT GCG CTG GGA GCG GGG ACG GTC 

,VR V R C D R R L R R G A L G A G T V 
^ VSGVTGGSVAVRW ERGRS 
C P V * P A A P S R C A G S G .D G ] 

RGAPCSAPHRVPGRRVRi 
EVPLAVPQIDCPG AGFEV 
KSRCPLQSSTARARASSS 

GAA GCT GGC CGT CCC GTT GAC CGA CCT ACA GCG TGC CCG GGC GCG GCT TGA GCT 
42507 42516 42525 42534 42543 42552 

CTT CGA CCG GCA GGG CAA CTG GCT GGA TGT CGC ACG GGC CCG CGC CGA ACT CGA 

LRPAGQLA GCRTGPRRTR 
FDRQGNWLDVARARAELD 
STGRATGWMSHGPAPNSI 

APRWGGSRPHGATSPAHi 
PPGGDGQGLTDPLAPLT H 
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Ql K - A> M G^- R - V- - S - P - T*'^-.R C H ' Q" S R T 



GAC CGC CCG GCG GTA GGG GGA CTG GOT CCC ACA GGC CGT CAC GAG OCT CGC ACA 
42561 42570 42579 42588 42597 42606 

CTG GCG GGC CGC CAT CCC CCT GAC CGA GGG TGT CCG GCA GTG CTG GGA GCG TGT 

LAGRHPPDRGCPA VLGAC 
WRAA IPLTEGVR QCWERV 
GGP PSP*PRVSGSAGSVC 

GRRRGPGKRRSASSP*VR 
EVVGAPGRGGRRALRDSA 
SWSAPRAGEAEVR*VT LR 

CGA GGT GCT GCG GCC GGC CCG GGG AAG GCG GAG CTG CGC GAT CTG CCA GTC TGC 
42615 42624 42633 42642 42651 42660 

GCT CCA CGA CGC CGG CCG GGC CCC TTC CGC CTC GAC GCG CTA GAC GGT CAG ACG 

APRRRP G PFRLDALDGQT 
LHDAG-RAPSASTR*TVRR 
STTP AGPLPPRRARR S DA 

VT L RT LRMRPR L S A P S W 
^^^y NSP*V R*VCGRVSRHRAG 
* TLRDSADSADASPAIGPE 

GCA ATC TGC CAG TCT GCG CAG TCT GCG TAG GCG CCT GCC TCG CTA CGG CCC GAG 
42669 42678 42687 42696 42705 42714 

CGT TAG ACG GTC AGA CGC GTC AGA CGC ATC CGC GGA CGG AGC GAT GCC GGG CTC 

R*TVRRVRRIRGRSDAGL 
VRRSDASDASA D GAMPGS 
L D GQ T R Q T HPR T E R C RA P 

GRVWRTTFGPMLATI LAQ 
GEYGGLPS ARC*RQS *PR 
VRTGVSHHLGA.DVSHD PG 

GTG GGA GCA TGG GTG GCT CAC CAC TTC GGG CCG TAG TTG CGA CAC TAG TCC CGG 
42723 42732 42741 42750 42759 42768 



%R:AC CCT CGT ACC CAC CGA GTG GTG AAG CCC GGC ATC AAC GCT GTG ATC AGG GCC 

H P R T H r" VV KPGINA VIRA 
TLVP TEW* SPAS TL *SGP 
PSYPPSG EARHQRCDQGL 

VPRNGADPQDGPLSGHRP 
SRGIGLTPSTVLYLGTAP 
PGASE. WRRAP*WTSVRPP 

ACC TGG CCG GCT AAG GGT CGC AGC CCG ACC AGT GGT CCA TCT CTG GGC ACC GCC 
42777 42786 42795 42804 42813 42822 

TGG ACC GGC CGA TTC CCA GCG TCG GGC TGG TCA CCA GGT AGA GAC CCG TGG CGG 

WTGRFPASGWSPGRDPWR 
GPADSQRRAGHQVETRGG 
DRPIPSVGLVTR*RPVAG 
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RLPRPRGDQRSGRQGTRR 
DYLDHADMKGPAESVPAA 
TTSTTPTWRAPLRASR .HP 



CCA GCA TCT CCA GCA CCC GCA GGT AGA ACG GCC CTC GGA GCG ACT GGC CAC GCC 
42831 42840 42849 42858 42867 42876 

GGT CGT AGA GGT CGT GGG CGT CCA TCT TGC CGG GAG CCT CGC TGA CCG GTG CGG 

GRRGRGRPSCREPR*PVR 
VVEVVGVHLAGS LADRCG 
S*RSWASILPGAS LTGAA 

ADRGGGDFPRERGGRAVP 
PMGAAAMLRANEAAALLQ 
PCGPRRW*VPTRPRRSCS 

GCC CGT AGG GCC GGC GGC GGT AGT TTG CCC GCA AGA GCC GGC GGC GCT CGT TGA 
42885 42894 42903 42912 42921 42930 

CGG GCA TCC CGG CCG CCG CCA TCA AAC GGG CGT TCT CGG CCG CCG CGA GCA ACT 



RASR PPPSNGRSRPPRAT 

■^^o o ..... o ........ . 



GIPAAAIKRAFSAAAS NW 



P RLQGGAPRRGPRAGAPR 
RVSNDEPLADAQA HAQQA 
ASPTTRRCP .TPRPTRRSP 

CCG CCT GCC TCA ACA GGA GGC CGT CCC GCA GCC GGA CCC GCA CGC GGA CGA CCC 
42939 42948 42957 42966 42975 42984 

GGC GGA CGG AGT TGT CCT CCG GCA GGG CGT CGG CCT GGG CGT GCG CCT GCT GGG 

GGRSCPPAGRRPGRA P A G 
ADGV VLRQGVGL GVRLL .G 
RTELSSGRASAWACACWA 

PGRAHRHRRRPHRGTGRG 
RDEHTGTV .ADHIDALGAV 

tATRTRAPSPTT STPWDRS 

GCG CCA GGA GCA CGC ACG GCC ACT GCC GCA GCA CCT ACA GCC GGT CAG GGC GCT 
42993 43002 . 43011 43020 43029 43038 

CGC GGT CCT CGT GCG TGC CGG TGA CGG CGT CGT GGA TGT CGG CCA GTC CCG CGA 

RGPRACR*RRRGCRPVPR 
AVLVRAGDGVVDVGQ SRD 
RSSCVPVTASWMSASPAT 

TRRLGGRRRGA RVRGHRA 
LEAF AVAGDVQ. E Y EA TAR 
WNPSPWRAT SRSTSPRPA 

GGT CAA GCC GCT TCC GGT GGC GCG GCA GCT GGA CGA GCA TGA GCC GGC ACC GCG 
43047 43056 43065 43074 43083 43092 

CCA GTT CGG CGA AGG CCA CCG CGC CGT CGA CCT GCT CGT ACT CGG CCG TGG CGC 
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CGA GGC CCC AGT AGC GCA GCC GGT CGA GOT TCA TCC GCC GGA ACG GCC GGA CAA 
43101 43110 43119 43128 43137 43146 

GCT CCG GGG TCA TCG CGT CGG CCA GCT CGA AGT AGG CGG CCT TGC CGG CCT GTT 

APG SSRRPARSRRPCRPV 
LRGH RVGQLEVGGLAGLL 
SGVIASASSK*AALP ACC 

P VRRVGPHVAAPLRQPLA 
QYVGSVLTFLRQYANRYL 
STCAPCWPSCGSTPTATS 

CGA CCA TGT GCG GCC TGT GGT CCC ACT TGT CGG CGA CCA TCC GCA ACG CCA TCT 
43155 43164 43173 43182 43191 43200 
^GCT GGT ACA CGC CGG ACA CCA GGG TGA ACA GCC GCT GGT AGG CGT TGC GGT AGA 
f L 

AGTRRTPG* TAA GRRCGR 
LVHAGHQGEQPLVGVAVE 
WYTPDTRVNSRW*ALR* S 

V RLVGRGGGGHRGQEGHR 
SEYFAGAEEETVD KN VTA 
RSTSRGPRRRRSTRT*RP 

CGC TGA GCA TCT TGC GGG GCC GGA GGA GGA GGC ACT GCA GGA ACA AGT GGC ACC 
43209 43218 43227 43236 43245 43254 

GCG ACT CGT AGA ACG CCC CGG CCT CCT CCT CCG TGA CGT CCT TGT TCA CCG TGG 




GCT CGT GCC TGC AGC GCC GGT CGT ACG 
43263 432-^2 43281 

CGA GCA CGG ACG TCG CGG CCA GCA TGC 



GCG ACA TCT CGC GGT CCA CCT GCG GCC 
43290 43299 43308 

CGC TGT AGA GCG CCA GGT GGA CGC CGG 



RARTSRPACRCRAPGGRR 
EHGRRGQHAAVE RQVDAG 
STDVAASMPL* SARWTPV 

VAAPRPLLRRRRRPLLRP 
SLLPDLFCAADGALYYGP 
PCCRTS SAPPTAPSTTAP 



ACC TGT CGT CGC CCA GCT CCT TCG TCC GCC GCA GCG GCC GCT CCA TCA TCG GCC 
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433^1-7:^- 43326 v . 43335' " ^ - ^4334^ **• ' 43353^ ' ' 43362 

TGG ACA GCA GCG GGT CGA GGA AGO AGG CGG CGT CGC CGG CGA GGT AGT AGC CGG 



W TAAGRGSRRRRRR GS SR 
.GQQRVE EAGGVAGEVVAG 
DSSGSRKQAASPAR* *P( 

RPLQRRRLLLGAGGTRGi 
GHFSDAVYSFDQEVRVGP 
ATSATP STPSTRSWGYAR 

CCG GCA CCT TCG ACA GCC GCT GCA TCC TCT TCA GGA CGA GGT GGG CAT GCG GGC 
43371 43380 43389 43398 43407 43416 

GGC CGT GGA AGC TGT CGG CGA CGT AGG AGA AGT CCT GCT CCA CCC GTA CGC CCG 

GRGS CRRRRRSPAPPVRP 
AVE AVGDVGEVLLHPYAR 
PWKLSAT*EKSCSTRTP< 

PLRREGHPRARDP IGRGi 
QYVGNAMLDRVTP SEEVL 
S TSATRWSTACPRPNRSW 

'^^ll^GA CCA TCT GCG GCA AGC GGT ACT CCA GCG CGT GCC AGC CCC TAA GGA GCT GGT 
43425 43434 43443 43452 43461 43470 

GCT GGT AGA CGC CGT TCG CCA TGA GGT CGC GCA CGG TCG GGG ATT CCT CGA CCA 

A G R R R S P * GRAR S G I P R p 
LVDAVR.HEVAHGRGFLDQ 
W*TPFAMRSRTyGDS ST5 

LGADGGPRRTGPPAGPV] 
SAL MAELDAHERRRELFR 
RPWCRRWTPTNGAASWSG 

CGC TCC GGT CGT AGC GGA GGT CCA GCC GCA CAA GGG CCG CCG CGA GGT CCT TGG 
43479 43488 43497 43506 43515 43524 

GCG AGG CCA GCA TCG CCT CCA GGT CGG CGT GTT CCC GGC GGC GCT CCA GGA ACC 

tARPASP PGRRVPGGAPGT 
RGQHRL QVGVFPAALQ E P 
E A S I A S R S A , C S R R R . S R N I 

GPPLRFRRQVPGRAAPDC 
DQHCVFGVSYRDGR LP IV 
TRTASSVSATGTG ACRS* 

CCA GGA CCA CCG TCT GCT TTG GCT GCG ACA TGG CCA GGG GCG CGT CGC CCT AGT 
43533 43542 43551 43560 43569 43578 

GGT CCT GGT GGC AGA CGA AAC CGA CGC TGT ACC GGT CCC CGC GCA GCG GGA TCA 

GPGGRRNRRCTGPRAAGS 
VLVADE TDAVPVPAQRDH 
SWWQTKPTLYRSPR .SGI 1 

LVLRGPRQHRQHGRHAFC 
WYWGDPASIVNIGGTPSS 
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GGG TCA TGG TCG GCA GGC CCC GCG ACT ACT GCA ACT ACG GGG GAC ACC CGC TTG 
43587 43596 43605 43614 43623 43632 

CCC AGT ACC AGC CGT CCG GGG CGC TGA TGA CGT TGA TGC CCC CTG TGG GCG AAC 

PSTSRPGR**R*CPLWAN 
PVPAVRGADDVDAPCGRT 
QY QP SGALMT. LMPPVGEL 

AAALRGALLGLDRRQPL D 
PLLSGGQWYGWIAVNRF I 
PCCRAA RGTAGSRSTASS 

ACC CGT CGT CGC TCG GCG GGA CGG TCA TCG GGG TCT AGC GCT GCA ACG CCT TCT 
43641 43650 43659 43668 43677 43686 

TGG GCA GCA GCG AGC CGC CCT GCC AGT AGC CCC AGA TCG CGA CGT TGC GGA AGA 

WAAA S R P A S S P R S .R R C G R 
GQQRAA LPVAPDRDVAE D 
GSSEPPCQ*PQIATLR KI 

^"'^ RAPPPEEPAQL HRRGPGL 
E HPRRNKL HKSIVGA RGS 
" RTRAAT R * T S PS S AP GAR 

AGA GCA CGC CCG CCG CCA AGA AGT CCA CGA ACC TCT ACT GCG GCC GGG CCG GGC 
43695 43704 43713 43722 43731 43740 

TCT CGT GCG GGC GGC GGT TCT TCA GGT GCT TGG AGA TGA CGC CGG CCC GGC CCG 

S R A G G G S S G A W R * R R P G P 
L VR A A V L QV L GD D A G P A,R 
SCGRRFFRCLEMTPARPE. 

RRHRLRVGRQGA*RHRP G 
ADIVYDFEESVLEGTDPD 
PTSSTT SSRASWSVPTPT 

f TCC GCA GCT ACT GCA TCA GCT TGA GGA GCG ACT GGT CGA GTG GCC ACA GCC ,CCA 
43749 43758 43767 43776 43785 43794 



^^JPiGG CGT CGA TGA CGT AGT CGA ACT CCT CGC TGA CCA GCT CAC CGG TGT CGG GGT 

R R R * R S R T P R * PAH R C R G ' 
GVDDVVELL ADQLTGVGV 
ASMT*SNSSLTSSPVSGS 

,AVGGWGRPRRRVARAQGH 
LWEAGAARDGDFLVRKVT 
WGSRGLRATATSCCAS SR 

GGT CGG TGA GGC GGG GTC GGC GCG CCA GCG GCA GCT TGT CGT GCG CGA ACT GGC 
43803 43812 43821 43830 43839 43848 

CCA GCC ACT CCG CCC CAG CCG CGC GGT CGC CGT CGA ACA GCA CGC GCT TGA CCG 

PATPPQP RGRRRT ARA*P 
QPLR PSRAVAVEQHALDR 
SHSAPAARSPSNS TRLTV 
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RGRHRRRGAQGREE PARP 
VGETVDAGQKVANKLLVH 
SARPSTPARSSR TR*SCT 

ACT GCG GGA GCC ACT GCA GCC GCG GGA CGA ACT GGC GCA AGA AGT CCT CGT GCA 
43857 43866 43875 43884 43893 43902 

TGA CGC CCT CGG TGA CGT CGG CGC CCT GCT TGA CCG CGT TCT TCA GGA GCA CGT 

*RPR*RRRPA*PRSSGAR 
DA LGDVGALLDRVLQEHV 
TPSVTSA PCLTAFFRSTW 

RLRRPRG ALLPRRSRLDE 
DFDDRDVQWSR VD PGFIK 
TSTT AT SRGP ASTPV S SR 

CCA GCT TCA GCA GCG CCA GCT GGA CGG TCC TCG CCT GCA GCC CTG GCT TCT AGA 
43911 43920 43929 43938 43947 43956 

GGT CGA AGT CGT CGC GGT CGA CCT GCC AGG AGC GGA CGT CGG GAC CGA AGA TCT 

GRSRRGRPARSGRRDRRS 
VEVVAVDLPGADVGTEDL 
SKS SR STCQERTSGPK I F 

ALRDGLGGQG L AAARREQ 
PWDIAWDEKGWR LLVGNK 
RGT SRGTRRAGACCCAT R 

AGC CGG TCA GCT AGC GGG TCA GGA GGA ACG GGG TCG CGT CGT CGT GCG GCA AGA 
43965 43974 43983 43992 44001 44010 

TCG GCC AGT CGA TCG CCC AGT CCT CCT TGC CCC AGC GCA GCA GCA CGC CGT TCT 

SASRSPSPPCPSAAARRS 
RPVDRPVLLAPAQQHAVL 
GQSIAQSSLPQRSSTPFL 

GHLRPLRGGGARRRPR HH 
VTYGRSDVEELAGVLDII 
RTVAPTSRRWRASST SS 

1^"" 

ACT GGC ACA TTG GCG CCC TCA GCT GGA GGA GGT CGC GCG GCT GCT CCA GCT ACT 

44019 44028 44037 44046 44055 44064 

TGA CCG TGT AAC CGC GGG AGT CGA CCT CCT CCA GCG CGC CGA CGA GGT CGA TGA 

*PCNRGSRPPPARRRGR* 
DRVTAGVDLLQRADEVDD 
TV*PRES TSSSAPTRSMM 

HPVLLRDVRRHPLAPLDG 
TRCSSAISEGIHYRP FTE 
PAARPPSRSASTTARSPR 

ACC ACG CCG TGC TCC TCC GCT AGC TGA GCG GCT ACA CCA TCG CGC CCT TCC AGA 
44073 44082 44091 44100 44109 44118 

TGG TGC GGC ACG AGG AGG CGA TCG ACT CGC CGA TGT GGT AGC GCG GGA AGG TCT 
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VT" c V G^-- 'T^- ' K'" -R- -It • S'-^ ^ G-^' S - A ^ G R S 

GAARGGDRLADVVAREGL 
VRHEEAIDSPMW*RGKVS 

TGIAERVHRGQQALLGGH 
RELLKVSMGAKSLLSAAT 
GNWYS*PCAPRASCPPRR 

GGG CAA GGT TAT CGA AGT GCC TGT ACG GCC GGA ACG ACT CGT TCC TCC GGC GGC 
44127 44136 44145 44154 44163 44172 

CCC GTT CCA ATA GCT TCA CGG ACA TGC CGG CCT TGC TGA GCA AGG AGO CCG CCG 

PVPIASRTCRPC*ARRPP 
PFQ*LHGHAGLAEQGGRR 
RSNSFTDMPALLSKEAAV 

IGGAWRRDRASKQVHLEG 
SGAPGGGIVLVKKSMSSG 
PDRRGVA S*SCKKPCPAG 

ACC TAG GGC GGC CGG GTG GCG GCT AGT GCT CGT GAA AAA ACC TGT ACC TCG AGG 

44181 44190 44199 44208 44217 44226 

' /i^TGG ATC CCG CCG GCC CAC CGC CGA TCA CGA GCA CTT TTT TGG ACA TGG AGC TCC 
Mrrf__ 1 • 

'WIPPAHRRS RALFWTW SS 
GSRRPTADHEHFFGH GAP 
DPAGPPPITSTFLDMELP 



SI I*TERRPA N R I S I F M R 
VSLEPKVDRR ^) A S L F S C G 
WQYNLN *TAACQPYFHVD 

GGT GAC TAT TAA GTC CAA AGT GCA GCG CCG CGT AAC GCC TAT CTT TAC TTG TAG 
44235 44244 44253 44262 44271 44280 

CCA CTG ATA ATT CAG GTT TCA CGT CGC GGC GCA TTG CGG ATA GAA ATG AAC ATC 

PLI IQVSRRGAL .RIEMNI 
H * * F R F HVA AHC G * K * T S 
'f ) TDNSGF TSRRIADRNEHP 



# 



CPYNHFVEGLTTAVS * HF 
A R T I T F Y K E S H L R_ S ART S 
P V P L Q S I S R R T Y D R R E L P 



GCC GTG CCC ATT AAC ACT TTA TGA AGA GGC TCA CAT CAG CGC TGC GAG ATC ACC 
44289 44298 44307 44316 44325 44334 

CGG CAC GGG TAA TTG TGA AAT ACT TCT CCG AGT GTA GTC GCG ACG CTC TAG TGG 

RHG* L*NTSPSVVATL* W 
GTGNCE ILLRV* SRRSSG 
ARVIVKYFS EC SRDALVE 

R*DKKMRS*TADAEPNTG 
D RTRR* ARSHLMRKP I LA 
IELGEEHAVIYCGSRS*H 



TTA GAG ATC AGG. AAG AAG TAC GCG CTG ATA CAT CGT AGG CGA AGC CCT AAT CAC 
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44343"* "~443S2'- - - - 4436r'^"-' ^^^^ 44379- 44388 

AAT CTC TAG TCC TTC TTC ATG CGC GAG TAT GTA GCA TCC GOT TOG GGA TTA GTG 

NL*SFFMRDYVASASGLV 
.1 SSPSSCATM*HPLRD * C 
S LVL LHA RLCS I R FG I S A 

LEAVTRYLLTIPVRTSVS 
SSRSRGTFSRSPFGRVSR 
RAGRGDQLPAHHSGAYQG 

GGC TCG AGG CGC TGG CAG GAC ATT TCC TOG CAC TAC CCT TGG GCG CAT GAC TGG 
44397 44406 44415 44424 44433 44442 

CCG AGC TCC GCG ACC GTC CTG TAA AGG AGC GTG ATG GGA ACC CGC GTA CTG ACC 

PSSATVL* RSVMGTRVL .T 
RAPRPSCKGA*WEPAY*P 
E LRDRPVKERDGNPRTDR 

ACKLAEDGVAE,DVQRTRE 
PASSLKTESPKMWKGP AN 
.' LRVQSSRRRRS*GSAPHT 



'fUffCTC CGC GTG AAC TCT CGA AGC AGA GGC TGC CGA AGT AGG TGA ACG GCC CAC GCA 
44451 44460 44469 44478 44487 44496 

GAG GCG CAC TTG AGA GCT TCG TCT CCG ACG GCT TCA TCC ACT TGC CGG GTG CGT 

EAHLRA S S PTAS S T C RVR 
RRT *ELRLRRLH PLAG CV 
GAL E S FV S DGF I H L P G A F 

GRLEGFLRAGQQPPLQ VH 
GASSASSAHARSHRC S SM 
GRPARRLPTRGATAAVP C 

AGG GGC GCC TCG AGC GGC TTC TCC GCA CGC GGG ACG ACA CCG CCG TTG ACC TGT 
44505 44514 44523 44532 44541 44550 

TCC CCG CGG AGC TCG CCG AAG AGG CGT GCG CCC TGC TGT GGC GGC AAC TGG ACA 

SPRSSPKRRAPCCGGNWT 
PRGA RRRGVRPAVA.ATGH 
P A E L A E . E A C A L L W R Q L D M 

VGVVRGGPRPFHDPQPHA 
SGSSGAVQVR STTRSPTR 
PGRR GPWRSAP LPGAPPA 

ACC TGG GGC TGC TGG GCC GGT GGA CCT GCG CCC TTC ACC AGG CCG ACC CCC ACG 
44559 44568 44577 44586 44595 44604 

TGG ACC CCG ACG ACC CGG CCA CCT GGA CGC GGG AAG TGG TCC GGC TGG GGG TGC 

WTPTTRPPGRGKWSGWGC 
GPRRPGHLDAGSGPAGGA 
DPDDPATWTREVVRLGVR 

VVVHEQAGGV GRRQVGGV 
S S S T^NRRAALVGV S C AA * 
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CGC TGC TGC TGC ACA AGO ACG CGC GGC GOT TGT GGG GCT GCG ACG TGC GGC GGA 
44613 .44622 44631 44640 44649 44658 

GCG ACG ACG ACG TGT TCC TGC GCG CCG CCA ACA CCC CGA CGC TGC ACG CCG CCT 

ATTTCSCAPPTPRRCTPP 
RRRRVPARRQHPDAARRL 
DDD VFLRAANTPTLHAAY 

VLEGPLAPPLGSVCTPVN 
SWSAPSPRHCGASAPRCT 
RGARRPPGTAARQRLDAR 

TGC TGG TCG AGC GGC CCC TCC CGG CCA CCG TCG GGC GAC TGC GTC CAG CCG TGC 
44667 44676 44685 44694 44703 44712 

ACG ACC AGC TCG CCG GGG AGG GCC GGT GGC AGC CCG CTG ACG CAG GTC GGC ACG 

T T S S P G R A G G S P L T Q V G T 
RPARRGGPVA AR*RRS AR 
DQ LAGEGRWQPADAGRHV 



G TR N G T .V F RGS S V S S * P Q 
GPATERSSAARPSRPSRS 
ERHPKGHRLPGLLGLVVA 



AAG GGC CAC GCC AAA GGG CAC TGC TTC GCC GGG CTC CTC TGG CTC CTG ATG CCG 
44721 44730 44739. 44748 44757 44766 

TTC CCG GTG CGG TTT CCC GTG ACG AAG CGG GCC GAG GAG ACC GAG GAC TAC GGG 

F P (v) RFPVTKRPEE TEDYG Av/'^' 
SRCGFP *RSGPR RPRT Ta'^ 
^ Q ^ SRDEAARGDRGLRL 

CMSALKRASSASASRS'QD 
AC RR WSGPRPRPRRGPST 
PVDVGAEQ GLVRVGVPVP 



ACC GTG TAG CTG CGG TCG AAG GAC CGG CTC CTG CGC CTG CGG CTG GCC CTG ACC 
44775 44784 44793 44802 44811 44820 



.^^^^GG CAC ATC GAC GCC AGC TTC CTG GCC GAG GAC GCG GAC GCC GAC CGG GAC TGG 

W H I D A S F L A E D A D A D R D W 
GT S T PA S WPR TRT P T G T G 
AHRRQLPGRGRGRRPGLV 

PSSSTIGGS*SLIKR *LT 
RHAPRSGA .PSRCSRGSCR 
GTLQVHDRRVVVLDEAV .V 



AGG CCA CTC GAC CTG CAC TAG GGC GGC CTG ATG CTG TTC TAG AAG GCG ATG TTG 
44829 44838 44847 44856 44865 44874 

TCC GGT GAG CTG GAC GTG ATC CCG CCG GAC TAC GAC AAG ATC TTC CGC TAC AAC 



SGELDVIPPDYDKIFRYN 
PVSWT* SRR TTTRSSATT 
R*AGRDPAGLRQDLPLQR 
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HDRPRASSSRSRNESVPS 
TTGRGPAAAGAGTRPCRR 
HPGAAPRQQEQ EQERVGA 



CAC ACC AGG GCG CCG GCC CGC GAG GAG GAG GAG GAG GAG AAG AGC CTG TGG CCG 
44883 44892 44901 44910 44919 44928 

GTG TGG TCC CGC GGC CGG GCG CTG CTG CTG CTG CTC CTG TTC TCG GAC ACC GGC 

VWSRGR ALLLLLLFS DTG 
CG PAAGRCCSCSCSRTPA 
VVPRPGAAAPAPVLGHRR 

SSAGVSIRAPEWRSTGGS 
PPRAWASGRRSGGPRAAA 
LLVRGRQDAGAGVQVHRR 

CTC CTC CTG CGC GGG TGC GAC TAG GCG CGG CCG AGG GTG GAC CTG CAC GGC GGC 
44937 44946 44955 44964 44973 44982 

GAG GAG GAC GCG CCC AGG CTG ATC CGC GCC GGC TCC CAC CTG GAC GTG CCG CCG 

EEDAPTLIR A GSHLDVPP 
RRTRPR*SAPAPTWTCRR 
f|P?^> GGRAHAD PRRLPPGRAAA 

SSGYPA SPV* RSAPSTPR 
APATHRPPCRGPPRP PPV 
QQ LRIARLAGVQLGPLHS 

GAC GAC CTC GGC ATA CCG CGC CTC CCG TGG ATG GAC CTC CGG CCC CTC CAC CCT 
44991 45000 45009 45018 45027 45036 

CTG CTG GAG CCG TAT GGC GCG GAG GGC ACC TAG CTG GAG GCC GGG GAG GTG GGA 

LLEPYGAEGTYLEAGEVG 
CWSRMARRAPTWRPGRWD 
AGAVWRG GHLPGGRGGGT 

SRGSLDAVPFAPSA*RHW 
: PGAA*TPWPSPRPRR .DTG 

«'^PVPRE PRGRPLGP VG I QA 


GCC CTG GCC GGC GAG TCC AGC CGG TGC CCC TTC CGG CCC CTG CGG ATA. GAC ACQ 
45045 45054 45063 45072 45081 45090 

CGG GAC CGG CCG CTC AGG TCG GCC ACG GGG AAG GCC GGG GAC GCC TAT CTG TGC 

RDRPLRSATG KAGDAYLC 
GTGRSGRPRGRPGTPICA 
GPAAQVGHGEGRGRL SVP 

GKRTC VGTALV -PVRGRKM 
GRGPACAPPWCR CGGAS * 
V.G EQHVRRHGVGAGARAE 



GTG GGG AAG GAC CAC GTG TGC GGC CAC 
45099 45108 45117 

CAC CCC TTC CTG GTG CAC ACG CCG GTG 



CGG TTG TGG CCG TGG GCG GGC GCG AAG 
45126 45135 45144 

GCC AAC ACC GGC ACC CGC CCG CGC TTC 
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TPSWCTRRWPTPAPARAS 
PLPGAHAGGQHRHPPALH 

.AWGFRSGTPCSSSSRGSP 

PGASGAARPAARVRGARR 
HGLRVQQGHPLE FEVPGV 

TAG CGG GTC GGC TTG GAG GAG GGG CAC CCC GTC GAG CTT GAG CTG GCC GGG CTG 
45153 45162 45171 45180 45189 45198 

ATG GCC CAG CCG AAC CTG CTG CCC GTG GGG CAG CTC GAA CTC GAC CGG CCC GAC 

MAQ PNLLPVGQLELDRPD 
WPSRTGCPWGSSNSTGPT 
GPAEPAARGAARTRPARR 

RYVGT S CATRRPR P L S M G 
ATCGPRAPLAGPGPCPCV 
PPVGRDLLCHAPAQALVY 

CCC GCC ATG TGG GGC CAG CTC GTC CGT CAC GCG GCC CCG GAC CCG TTC CTG TAT 

; 45207 45216 45225 45234 45243 45252 

]^GGG CGG TAG ACC CCG GTC GAG CAG GCA GTG CGG CGG GGC CTG GGC AAG GAC ATA 

MtL. 

GRYTPVEQAVRRGLGKDI 
GGTPRS SRQCAGA WARTY 
AVHPG RAGSAPGPGQGHT 

RRSPRHRSPPSAPRPAGR 
AVLPGTVLHRLLLGHRGG 
RSSLAPSSIASFCATAGG 



GGC GCT GCT CTC CCG GCC ACT GCT CTA 
45261 45270 45279 

CCG CGA CGA GAG GGC CGG TGA CGA GAT 



CCG GCT CTT CGT CCG GCA CCG CGG GGG 
45288 45297 45306 

GGC GGA GAA GCA GGC CGT GGC GCC CCC 




GAC CTG CCT GGA CTA GGC 
45315 45324 
CTG GAC GGA CCT GAT CCG 



CGA CCA GAA GCC GCC TTA 
45333 45342 
GCT GGT GTT CGG CGG AAT 



CCG GTG GGT CCA GCA CCC 
45351 45360 
GGC CAC CCA GGT CGT GGG 




GGA CCG CCA CGC CGA CGC CGA CGG GCT GCG CTA GCC CCT CCC GCT TGC CTG GCG 
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' ' 4^53Tff^"^ • ' 4S3B7^ -4S3^96"^'" - 45405— ' 45414 

CCT GGC GGT GCG GOT GCG GCT GCC CGA CGC GAT CGG GGA GGG CGA ACG GAC CGC 



PGGAAAAARRDRGGRT DR 
.LAVRLRLPDAIGEGERTA 
WRCGCGCPTRSGRANGPP 

RAPRRSRSRVRQWSGATA 
VPQGGVELAFGSGH VPQQ 
SPSAASKSLS6AAMFRSN 

GCT GCC CGA CCG GCG GCT GAA GCT CTC GCT TGG GCG ACG GTA CTT GGC CGA CAA 
45423 45432 45441 45450 45459 45468 

CGA CGG GCT GGC CGC CGA CTT CGA GAG CGA ACC CGC TGC CAT GAA CCG GCT GTT 

RRAGRRLRERTRCHEPAV 
DGLAAD FE SEPAAMN RL L 
TGWPPT SRAN PLP * T GCC 

RGPRAR LAARTWARRTRG 
AAQGRE SHQALGLGAHEG 
RPRAAS PT SRSDL GP TNA 

^ 

^^^EGC GCC GGA CCG GCG CGA QCC TCA CGA CGC GCT CAG GTT CGG GCC GCA CAA GCG 
45477 45486 45495 45504 45513 45522 

GCG CGG CCT GGC CGC GCT CGG AGT GCT GCG CGA GTC CAA GCC CGG CGT GTT CGC 

ARPGRARSAARVQARRVR 
R GLAALGVLRESKPGVFA 
AAWPRSECCASPSPACSP 

SVPR PVADRRGSATRGSV 
QCRDPF QTAGVARRGEV* 
RVGT P S SRR ASRE GD KWE 

GGA CTG TGG CCA GCC CCT TGA CGC AGC GCG GCT GGC GAG CGG CAG GAA GGT GAG 
45531 45540 45549 45558 45567 45576 

CCT GAC ACC GGT CGG GGA ACT GCG TCG CGC CGA CCG CTC GCC GTC CTT CCA CTC 

DTGRGTASRRPLAV LPL 
'iPf) LTPVGELRRADRSPSFHS 

- * H R S G - N C :V A -P, - T - A . . R R P S T H 

PGSA*RDRPRSPRAAGPG 
QGP H E G I GRDRRG P L VQV 
SARI SVSGATAVAQCCRS 

TGA CCG GGC CTA CGA GTG GCT AGG GCG CCA GCG CTG CCG GAC CGT CGT GGA CCT 
45585 45594 45603 45612 45621 45630 

ACT GGC CCG GAT GCT CAC CGA TCC CGC GGT CGC GAC GGC CTG GCA GCA CCT GGA 

TGPDAHRSRGRDGLAAPG 
LARMLTDPAVAT AWQHLD 
WPGCSPIPRSRRPGSTWT 

CRGCRRGPRRGRRRGPSR 
VADAGAARGE VVDEAPVE 
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GGT GTC OCA GGC GTG GCC GCC GGG CCG GAA GCT GGT GCA GAA GCC GGC CCT GAA 
45639 45648 45657 45666 45675 45684 

CCA CAG CGT CCG CAC CGG CGG CCC GGC CTT CGA CCA CGT CTT CGG CCG GGA CTT 



pqrph,rrpglrprlrpgl 
hsvrtggpafdhvfgrd f 
tasapaarpsttssagti 

rtg'pprgrgttarcrps 2 
ervqrvvgvqrpevvrrh 
kayras sgsrdhs*laai 

gaa gcg cat gga ccg cct gct ggg gct gga cag cac cga gat gtt gcg ccg cta 
45693 45702 45711 45720 45729 45738 

CTT CGC GTA CCT GGC GGA CGA CCC CGA CCT GTC GTG GCT CTA CAA CGC GGC GAT 

LRVPGGRPRPVVALQRGD 
FAYLADDPDLSWLYNAAM 
SRTWRTTPTCRGSTTR R^ 

i 

GPCRHSRRGPRPAGPSRI 
(|p; ALAGTPD GAQDRRVLVE G 
LWPVPP lAPRTAACWSKE 

CTC GGT CCC GTG GCC ACC CTA GCG GCC GGA CCA GCG CCG CGT GGT CCT GAA GAG 
45747 45756 45765 45774, 45783 45792 

GAG CCA GGG CAC CGG TGG GAT CGC CGG CCT GGT CGC GGC GCA CCA GGA CTT CTC 

E P G H R W E>.R R R G R G A P G L L 
SQGTGG l AGLVAAHQDFS 
ARAPVGSPAWSRRTR TS] 

RGCRPPRRPRPRSA AP R3 
ADAGHHVDPAPVPRQQG. R 
PTRVTT STPPPSPVSSAA 

GCC GCA GGC GTG GCA CCA CCT GCA GCC CCC GCC CCT GCC CTG CGA CGA CCG GCG 
45801 45810 45819 45828 45837 45846 

^IP^CGG CGT CCG CAC CGT GGT GGA CGT CGG GGG CGG GGA CGG GAC GCT GCT GGC CGC 

N^^--- , . 

R R P H R G G R R G R G R D A A G R 
GVRTVVDV GGGDGTLLAA 
ASAPWW TS GAGTGRCW P I 

AARAGRAARRAT RS PPRI 
HQARVG RQAAHQVVRRGP 
TSRACGESRPTSYSEAAP 

CCA CGA CGC GCG CGT GGG GAG CGA CGC GCC GCA CGA CAT GCT GAG CCG CCG GCC 
45855 45864 45873 45882 45891 45900 

GGT GCT GCG CGC GCA CCC CTC GCT GCG CGG CGT GCT GTA CGA CTC GGC GGC CGG 

GAARAP LAARRAVRLGGR 
VLRAHP SLRGVIiYD SAAG 
CCARTPRCAACCTTRRPG 
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RAPRPPAPPPPRRPGRPP 
DRLGPIiHQRRRADRVARH 
TACAPST SA AAPTASRAT 



CCA GCG CGT CCG GCC COT CCA CGA CCG CCG CCG CCC GCA GCG CCT GGC GCG CCA 
45909, 45918 45927 45936 45945 45954 

GGT CGC GCA GGC CGG GGA GGT GCT GGC GGC GGC GGG CGT CGC GGA CCG CGC GGT 

GRAGRGGAGGGGRRGPRG 
VAQAG EVLAAAGVADRAV 
SRRPGRCWRRRASRTARW 

PRRSRRRRVRPRHGRGA* 
LGAVEEGGYGLATVE VQE 
SAPSKKAATGSPPSR*RS 

CCT CCG GCC GCT GAA GAA GCG GCG GCA TGG GCT CCC GCC ACT GGA GAT GGA CGA 
45963 45972 45981 45990 45999 46008 

GGA GGC CGG CGA CTT CTT CGC CGC CGT ACC CGA GGG CGG TGA CCT CTA CCT GCT 

GGRRLL RRRTRGR*PLPA 
E A GD FFAAVPEGGDLYL L 
■ifliP// RPAT S S PPYPRAV T S T C S 

SRRG ^HSPPRAPRSSEPAS 
L\AD D MA P L VL P G'R P N Q R V 

LLTTWPQSSSRAAL IRAC 

GTT CTC GCA GCA GGT ACC GAC CCT CCT GCT CGC CCG GCG CTC CTA AGA CCG CGT 
46017 46026 46035 46044 46053 46062 

CAA GAG CGT CGT CCA TGG CTG GGA GGA CGA GCG GGC CGC GAG GAT TCT GGC GCA 

QERRPWLGGRAGRED SGA 
KSVVHGWEDERAARI LA .H 
RA SSMAGRTSGPRGFWR T 

GGPVAP ARGSR*PRAGAA 
") AAPCQRRVA PDDHDLVQQ 
' pRRASGACPRI^TMTSCRS 



fyi^ T.-- 

ji^GAC GGC GGC CCG TGA CGG CCG CGT GCC GGC CTA GCA GTA.CCA GCT CGT QGA CGA 
46071 46080 46089 46098 46107 46116 

CTG CCG CCG GGC ACT GCC GGC GCA CGG CCG GAT CGT CAT GGT CGA GCA CCT GCT 

LPPGTAGARPD RHGRAPA 
CRRALPAHGRIVMVEHLL 
AAGHCRRTAGSSW S S T C C 

RCPARPRRASS RG*RG*G 
GVRHGRVGHRRGVEVVEV 
GSVTGASATGVV* R L SRL 



CGG GCT GTG 
46125 
GCC CGA CAC 



CCA CGG GCG 
46134 
GGT GCC CGC 



CCT GCG GCA 
46143 
GGA CGC CGT 



CGG CTG CTG 
46152 
GCC GAC GAC 



GAT GGA GTT 
46161 
CTA CCT CAA 



GCT GGA GTT 
46170 
CGA CCT CAA 
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PDTVPADAVPTTYLNDLN 
PTRCPRTPCRRPTSTTST 

.AP*RCRAPACAHRSRVAR 
Q QDVAVPQLARTAVE FLE 
RSTLPL PSSRVRPSKSCS 

GGA CGA CCA GTT GCC GTT GCC CGA CCT CGC GTG CGC ACC GCT GAA GCT TGT CGA 
46179 46188 46197 46206 46215 46224 

CCT GCT GGT CAA CGG CAA CGG GCT GGA GCG CAC GCG TGG CGA CTT CGA ACA GCT 

PAGQRQRAGAHAWRLRTA 
LLVNGN GLERTRGDFEQL 
CWSTATGWSARVATSNS S 

RPPPGSPRLP*AAPRFRG 
ARRRAQRDFRDRRQG SGV 
QAAAPRVTSATVGSAPV S 

GAC GCG CCG CCG CCC GGA CTG CCA GCT TCG CCA GTG CGG CGA CCG GCC TTG GCT 
46233 46242 46251 46260 46269 46278 

■ .CTG CGC GGC GGC GGG CCT GAC GGT CGA AGC GGT CAC GCC GCT GGC CGG AAC CGA 

. 

'^ LRGGGPDGRSGHAAGRNR 
CAAAGLTVEAVTPLAGTD 
ARRRA*RSKR SRRWPEPT 

TASRPRARKPQGARSLPG 
QPQDLGHGSRS VR.EASRG 
RHSISATGAEASGSPQAA 

GGA CAC CGA CTA GCT CCG GCA CGG GCG AAG CCG ACT GGG CGA GCC GAC TCG CCG 
46287 46296 46305 46314 46323 46332 

CCT GTG GCT GAT CGA GGC CGT GCC CGC TTC GGC TGA CCC GCT CGG CTG AGC GGC 

PVADRGRARFG*PAR LSG 
L. WLIEAVPASADPLG*AA 
CG*SRPCPLRLTRSAERP 
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^^EPFKVTSPLRMAPDP RI T 
W K R S N * R A R S G * Q P I P G. F P 
R G P I E G H E P A E N R S R A S H 

GGA AGG CCC TTA AAG TGG CAC GAG CCC TCG GAG TAA CGC CCT AGC CCG GCT TAC 
46341 46350 46359 46368 46377 46386 

CCT TCC GGG AAT TTC ACC GTG CTC GGG AGC CTC ATT GCG GGA TCG GGC CGA ATG 

PSGNFTVLGSLIAGSGRM 
LPGI SPCSGASL RDRAEW 
FREFHRAREPH CGIG PNG 

TGDLLPR*HI**VAQAFL 
RGMWCPVSTFESYQKRSC 
DDWGAL SALSNVI S SARV 



CAG CAG GGT AGG TCG TTC CCT GCG ATC ACT TAA GTG ATA TGA CGA ACG CGC TTG 

- 181 - 



463*95^ 464*04^ 46413"^' 46422 464^'T ' • 4644 0 

GTC GTC CCA TCC AGC AAG GGA CGC TAG TGA ATT CAC TAT ACT GCT TGC GCG AAC 



VVPSSKGR**IHYTACAN 
.SSHPARDASEFTILLART 
RPIQQGTLVNSLYCLREQ 

SKGPSKGYRKRHSAIRMI 
HNVQARGT GNGTVPSVC* 
TI*RPEERVTEPSQRYAN 

TCA CTA AAT GGA CCC GAG AAG GGC ATG GCA AAG GCC ACT GAC CGC TAT GCG TAA 
46449 46458 46467 46476 46485 46494 

AGT GAT TTA CCT GGG CTC TTC CCG TAC CGT TTC CGG TGA CTG GCG ATA CGC ATT 

SDLPGLFPYRFR*LA IRI 
VIYLGS SRT VSGDWRYAL 
*FTWALPV PFPVTGDTHY 

*PQSI IRDLRASMVPIVP 
ER SPSSET*ALA**PF *Q 
\NV- APLHNQRPSRENRSDS 

g^iHAA GTG CCG ACC CTC TAC TAA GAC AGA TCC GCT CGC GAG TAA TGC CCT TAG TGA 
" 46503 46512 46521 46530 46539 46548 

ATT CAC GGC TGG GAG ATG ATT CTG TCT AGG CGA GCG CTC ATT ACG GGA ATC ACT 

. I H G W E ILSRRALITGIT 
FTA GR*FCLGERSLRESL 
S.RLGDD SV*AS.AHYGN H W 

^ 

wspv*r ar*s msdpystk 
gp hc k g radv * r i r i h l r 

AL IAS V ER TLEDFGS I FD 

CCG GTC CTA CCG TGA ATG GAG CGC GCA GTT GAG TAG CTT AGG CCT ATA CTT CAG 
46557 46566 46575 46584 46593 46602 

GGC CAG GAT GGC ACT TAC CTC GCG CGT CAA CTC ATC GAA TCC GGA TAT GAA GTC 

\ : 

G Q D G T Y L A R Q L I E S G Y E V 
^pf^^A RMALTSRVNSSNPDMKS 
<KP P G W H L P R A .S T H R I R I ★ S L 

PITRPCPRGYARSPR GRC 
RFPARAPGATHGRRDAGA 
ESH HAP LAPRIGAVTPGQ 

AAG CCT TAC CAC GCG CCC GTC CCG GCC GGC ATA CGG GCG CTG CCA GCC GGG GAC 
46611 46620 46629 46638 46647 46656 

TTC GGA ATG GTG CGC GGG CAG GGC CGG CCG TAT GCC CGC GAC GGT CGG CCC CTG 

FGMVRGQ GRPYARDGRPL 
SEWCAGRAGRMPATVGPC 
RNGARAGPAVCPRR SAPA 

GSMRTTLPSKSSWVLRIA 
GPCGLPSRRSAPGSSGSR 
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GTG GGC CTG TAG GCT CAC CAC TCG CCG CTG AAC GAC CTG GTC TGC TCG GAG TAG 
46665 46674 46683 46692 46701 46710 

CAC CCG GAC ATC CGA GTG GTG AGC GGC GAC TTG CTG GAC CAG ACG AGC CTG ATC 

HPDIRV ySGDLLDQTSLI 
TRTSEW*AATCWTRRA*S 
PGHPSGERRLAGPDEPDR 

ATSCDQGVSI*LRPARDN 
QQRATRGWRSRCGRRGTT 
SSDLLGAGGLDVVEAGQR 

CGA CGA CAG CTC GTC AGG ACG GGG TGG CTC TAG ATG TTG GAG CCG CGG GAC AGC 
46719 46728 46737 46746 46755 46764 

GCT GCT GTC GAG CAG TCC TGC CCC ACC GAG ATC TAC AAC CTC GGC GCC CTG TCG 

AAVEQSCPTEIYNLGALS 
LLSSSPAPPRSTTSAPCR 
CCRAVLPHR DLQPRRP VV 

TGTEQF CGVTAASTVPLP 
4ip)[:R GPRRSAAWRQRPPSRCP 




EDR DGPLLGG NGRLHGAL 

AAG CAG GGC CAG AGG ACC TTC GTC GGG TGG CAA CGG CGC CTC CAC TGG CCG TTC 
46773 46782 46791 46800 46809 46818 

TTC GTC CCG GTC TCC TGG AAG CAG CCC ACC GTT GCC GCG GAG GTG ACC GGC AAG 

FVPVSWKQPTVAAEVTGK 
SSRSPGSSPPLPRR*PAR 
RPGLLEAAH RCRGGDRQG 

T S R I S S AMRMVAP S L L E R 
HAASAPPWGC*PPA* CNG 
THQPHQLGD ADRRPEATG 

> CCA CAC GAC GCC TAC GAC CTC CGG TAG GCG TAG TGC CGC CCC GAG TCG TCA AGG 
46827 46836 46845 46854 46863 46872 

#&T GTG CTG CGG ATG CTG GAG GCC ATC CGC ATC ACG GCG GGG CTC AGC AGT TCC 
--- . --- . 

G. V L R M L E A I R I TAG L S S S 

VCCGCWRPSASRRGSAVP 
CAADAG GHPHHGGAQQ FP 

VVLLPTGRK**AEVESIN 
S W W C R R G A S R D P R W R P S T 

PGGAAADRAEILGGGRLH 

GCC TGG TGG TCG TCG CCG CAG GGC GCG AAG ATA GTC CGG AGG TGG AGC CTC TAC 
46881 46890 46899 46908 46917 46926 

CGG ACC ACC AGC AGC GGC GTC CCG CGC TTC TAT CAG GCC TCC ACC TCG GAG ATG 

RTTSSGVPRFYQASTSEM 
GPPAAASRASIRPPPRRC 
DHQQRRPALLSGLHLGDV 
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PFTRSDGCLSAVGKWGRL 
R FPAPTGA SRPWARGG AC 
ESLHP. L GRLALGRGEVRA 

AAG OCT TTC CAC GCC CTC AGG GGC GTC TCG CTC CGG TGC GGG AAG GTG GGC GCG 
46935 46944 46953 46962 46971 46980 

TTC GGA AAG GTG CGG GAG TCC CCG CAG AGC GAG GCC ACQ CCC TTC CAC CCG CGC 

FGKVRE SPQSEATPFHPR 
SERCGSPRRARPRPSTRA 
RKGAGVPAERGHALPP AQ 

G*PTALANPC*MTCF*RS 
GRRP PW PTRASC PA S S GR 

AGVPHGLR EPV VHHLVVA 

TCG GGG ATG CCC CAC CGG TTC CGC AAG CCC GTG ATG TAC CAC GTC TTG ATG GCG 
46989 46998 47007 47016 47025 47034 

AGC CCC TAC GGG GTG GCC AAG GCG TTC GGG CAC TAC ATG GTG CAG AAC TAC CGC 

SPYGVAKAFGHYM. VQNYR 
APTGWPRRSGTTWC .RTTA 
PLRGG QGVRALHGAELPR 

DYPINATLPIRNLWSDGI 
TTRSTRP*RSGT*GRTVS 
LRVP H E RDA PDQ E V V L * ,R 

CTC AGC ATG CCC TAC AAG CGC CAG TCG CCC TAG GAC AAG TTG. GTG CTC AGT GGC 
47043 47052 47061 47070 47079 47088 

gag tcg tac ggg atg ttc gcg gtc agc ggg atc ctg ttc aac cac gag tca ccg 
esygmfavsgilfnhesTp 

S R T G C S R SAG SC S T T S H' R 
VV RDVRGQRDPVQPRVTD 

RPGSNTVRLTDSPTAATF 
GPGPTR*ACP. TARPPRRS 

DPARLEDRALHREPHGGH 



'WyThG GCC CCG GGC CTC AAG CAG TGC GCG TTC CAC AGC GAG CCC CAC CGG CGG CAC 
47097 47106 47115 47124 47133 47142 

ATC CGG GGC CCG GAG TTC GTC ACG CGC AAG GTG TCG CTC GGG GTG GCC GCC GTG 

IRGPEFVTRKVSLGVAAV 
S GAR S S SRAR CR S G WP P * 
PGPGVRHAQGVARGGRRE 

SPRI SLSRSPLRSASRS Q 
APGSP CAGAPCG P P P V R S 
LQAQHVLEPQAVQLRFAV 

TTC GAC CCG GAC TAC CTG TTC GAG GCC GAC CCG TTG GAC CTC CGC CTT GCG CTG 
47151 47160 47169 47178 47187 47196 

AAG CTG GGC CTG ATG GAC AAG CTC CGG CTG GGC AAC CTG GAG GCG GAA CGC GAC 
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SWA*WTSSGWATWRRNAT 
AG P DGQAPAGQPGGGTRL 

.P KA P S * T R PMV I I S A W S S 
P SRLPSRARCSS S ARGPR 
PAECPV VHAAHRHHEGLV 

ACC CCG AAG CGT CCC CTG ATG CAC GCG CCG TAG TGC TAG TAG GAG GGG GTC CTG 
47205 47214 47223 47232 47241 47250 

TGG GGG TTC GCA GGG GAG TAG GTG CGC GGC ATG ACG ATG ATG CTC GCC GAG GAG 

WGFAGDYVRGMTMMLAQD 
GASQGTTCAA*R*CSPRT 
GLRRGLRARHDDDARPGR 

GSSRTRPVPIVWRT RSRT 
APPGRGRCRS*GGPARDP 
LRL VEDEAGPDGVPHAIQ 

CTC GGC CTC CTG GAG GAG GAG CCG TGG CCC TAG TGG GTG GCC CAC GCG CTA GAG 
. 47259 47268 47277 47286 47295 47304 
GAG CCG GAG GAG CTC GTC CTC GGC ACC GGG ATG ACC CAC GGG GTG CGC GAT CTG 




E P E D L V L G T G I T H R V R D .L 
S. RRTSS SAPGSPTGCA I W 
A GGPRPR HRDHPPG AR S G 

SKAKACTPSSQRSWTSTS 
P N RR RA RRA P SA R GR P P P 
HIEGERVDPQVPAVVHL 'H 

CAC CTA AAG CGG AAG CGC GTG GAG CCC GAG CTG ACC GCG CTG GTG CAC CTC CAC 
47313 47322 . 47331 47340 47349 47358 

GTG GAT TTC GCC TTC GCG CAC GTC GGG CTG GAC TGG . CGC GAC CAC GTG GAG GTG 

VDFAFAHVGLDWRDHVEV 
WI SPSRTSGWTGATTWRW 
GFRLRARRAGLARPR GGG 

/Jf^ ERSSRGASTSSSQ ASRLR 
S G A A A G P P P P V A R R R G . S G 
VGPQQARRLHFQEAGVQA 

CTG AGG GCC GAC GAC GCG GGC CGC CTC CAC CTT GAC GAG ACG CGG CTG GAC TCG 
47367 47376 47385 47394 47403 47412 

GAC TGC CGG CTG CTG CGC CCG GCG GAG GTG GAA CTG CTC TGC GCC GAC CTG AGC 

DSRLLRPAEVELLCADLS 
TPGCCARRRWNC SAPT *A 
LPAA APGGG GTALRRPEP 

ARCFSPQFGSTENSSSTA 
REASARSSARPRTRPVPR 
ASPLLEAPLGLDRELFQD 



GCG CGA GCC GTC TTC GAG CCG ACC TTC GGG CTC GAG AGC AAG CTC CTT GAC GAG 
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47.4^T- ~ - :-47'430'" ' 47439 '= ' 47445 4T457 47466 

CGC GCT CGG GAG AAG CTC GGC TGG AAG CCC GAG GTC TCG TTC GAG GAA CTG GTC 

'r' "k r' q' k' L G W K P E V S F E E L V 
A LG RSSAGSPRSRSRNWS 

RSAEARLEARGL VRGTGR 

MTTSLSRRRSVSLSSAAP 
/sP'RCRGAGA*RCHPRRR 
G H H D V A V Q A Q E G V _L_ y_ G_ 

iAC ilc 'caI 'cVg VcG cVg ^G GAG GAG TGG CTG TCA CTC CTG CGG CGG 

47475 47484 47493 47502 47511 47520 

GCC ATG ATG GTC GAC AGC GAC CTG CGC CTG CTC ACC GAC AGT GAG GAC GCC GCC 

"a' 'm 'm 'v' d' S D L R L L T D S E d a a 

p * WSTATCACSPTVRTPP 

hdgrqRPapah rq*grrr 

SATRSCAPRHHAERCALD 

rprervprd ttlrgap wt 

A L G N E F L G T Q P S G ^P _P_ 

^fk cic CGG cIa gag CTT GTC CGG CCA GAC ACC ACT CGG AGG GCC GTC CGG TCC 
47529 47538 47547 47556 47565 47574 

GGC GAG GCC GTT CTC GAA CAG GCC GGT CTG TGG TGA GCC TCC CGG CAG GCC AGG 



arpfsnrpv cg epp grpg 

R G R S R T G R S V 0 S L P A G Q V 



geavleqaglw*asrqar 

P V C G,,,^ E 
R S V (VJ S 

-=> 

AAECSCSGEGRLRVQRVD 
P PRARARARGESAYRD S T 

R R G R V L V L 6 G R P P 

AGC CGC CGG AGC dTG CTC GTG CTC GGG AGG GGA GCC TCC GCA TGG ACA GCC TGC 
47583 47592 47601 47610 47619 47628 

TCG GCG GCC TCG CAC GAG CAC GAG CCC TCC CCT CGG AGG CGT ACC TGT CGG ACQ 

■ .'s' T ~l~ s" 'h' 'e' H E P S P R R R T C R T 

/Mr rprtstspplggvpv gr 

m\ o L A R A R..A L P S E A Y L S D V 

gtrledvpegpagggrla 

APAS NMSQNARHEAAACH 
rrHPT*R STRGTSRRRA^ T 

AGC ^C CAC GCC TCA Aci AGC ^GA CCA AGC GGG CCA CGA GGC GGC GGC GCG TCA 
47637 47646 47655 47664 47673 47682 

TCG CCG GTG CGG AGT TCA TCG ACT GGT TCG CCC GGT GCT CCG CCG CCG CGC AGT 



SPVRSS STGSPGAPPPRS 

rrcgvhrlvrpvlrrrav 

A 



gaefid wfarcsaaaqc 



PHRPRRQGLQPSPPEVG V 

rtvragsvssrrhrnsas 
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IN 



RGDLGGAAVVGADVLA R J 
G V T W A V R I. L * V R M W W ^ J> J- 

A s R G p = « = °. .-- 



GOC ice GOT GGG CGT^CGT TGA TGX^GCG CG. AGG^^ TCC CGG^CO. 

CGC CgI Cci TCC AGG CCA CCC GCA GCA ACT ACA CCC GCA TCC ACC AGG GCC GCA 

-oT^AATTPASTRAA 

% \ \ H P Q Q I. H P H P P G P Q 
\ W \ \ T \ S % Y T R I H Q G R S 



rTIQLEEGLGARAAGQ H 
V R . R S N K V L A P A P R V R T S 

C G N D% T R « W P R R P G C_ _G 



GCA CCC OTT ATC TG^ ACT TCT TCA CCA AGG CCG GCG CGG GCC GCA CCC TGG TGG 



£ aIg AC G i JCG XCC C^^^ C^ ^G^ACG CG^ icG^C^^ l^^^^ 

ACG TcTtZ AGT CCG AGC AGG GCG CGT GGT TTC TGC GCA AGC GCA ACC GCA ACA 



{ \ "\ % \ \ \ \ ^ °V % =A \ ^ \ % \ ^ 
\ \ *Q S E Q G A W F L R K R N R H M 



„T HSLVHGGG LAVVPQR 
t « T a S T G a a L P . W Q S G 

p R G P P Q f K * « « " ^ ^_ °_ 



'#ACC TCC ACC GAC XCC .GC^ACG GGC GGC^GGX TCC CGA^TGG TGA CCG^ACG 

TGG TCG ice AGG TGG CTG AGG ACG TGC CCG CCG CCA AGG GCT ACC ACT GGC TOC 



W s S R W L K T ' " r „ T . A 

G R P G G * G R A R R Q G L P L A A 

V V O V A E D V P A A K G Y H W L P 



orFOPPQQADV .AQDVHVG 

£ i GGC £g ACG CCG CCG IcG^ACG ^GT llc.^^ CG^ - 

CGC TGA icG AAC TGC GGC GGC TGC TGC GCA TCG ACG GCC TGG TCA ACA TGG ACA 
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CGT GAG GCC TCG TCT AGT GGG TGC TCC TGC CCG CCG TOA s.^. v.-. -v.x 
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Q 



R L 
G S 
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Q 



AGG AGC TGA TGC AGG ACT GGC GAA GGG GCC TCG CGG AGG AGA TGT CAC GGC AGG 
48717 48726 48735 48744 48753 48762 

TCC TCG ACT ACG TCC TGA CCG CTT CCC CGG AGC GCC TCC TCT ACA GTG CCG TCC 

gSTTS -^PLPRSASSTVPS 
pRLRP DRFPGAPPLQCRP 
LDYVLTASPERLLYSAVL 

GLLAPAEVVRLVAIEQDL 
AS SP PRK * WECF L * RR T S 
PRPPRASRGSASCSDGPR 

ACC GGC TCC TCC CGC CCG CGA AGA TGG TGA GCG TCT. TGT CGA TAG AGG ACC AGC 
48771 48780 48789 48798 48807 48816 

TGG CCG AGG AGG GCG GGC GCT TCT ACC ACT CGC AGA ACA GCT ATC TCC TGG TCG 

WPRRAGA S TTR.R TA I S W S 
GRGGRALLPLAEQLS PGR 
AEEGGRFYHSQNS YLLVE 

GVVVEG YG DGIVVAPHGG 
SSSKGTATGSS*QQTVA 
PRRRSGRLRGRHSSSPSR 

TCC GGC TGC TGC TGA AGG GGC ATC GGC AGG GGC TAG TGA TGA CGA CCC ACT GGC 
48825 48834 48843 48852 48861 48870 

AGG CCG ACG ACG ACT TCC CCG TAG CCG TCC CCG ATG ACT ACT GCT GGG TGA CCG 

RPTTTSP*PSPMTT .AG*P 
GRRRLPR .SRPR*LLLGDR 
A D D D F P V A V P D D Y C W V T A 

VLEGPEQPVAV VDVDLGP 
WWSVRSRRCP**TLTSAR 
GGA*GAGAARSSR*RRPG 

GGG TGG TCG AGT GGG CCG AGG ACG CCG TGC CGA TGA TGC AGT TGC AGC TCC GGG 
48879 48888 48897 48906 48915 48924 

JfeeC ACC AGC TCA CCC GGC TCC TGC GGC ACG GCT ACT ACG TCA ACG TCG AGG CCC 

— 

P T S S P G S C G T A T T S T S R P 
ppAHPAPAARLLRQRRGP 
HQLTRLLRHGYYVNVEAR 

AQEGAQLTPSG MFFSRGT 
LRSAQRCLQHG WSSRADR 
SGARRGASNTVGHLVLT G 

CCT CGG ACG AGC GGA CGG ACG TCT CAA CCA CT6 GGG TAC TTC TTG CTC GCA GGG 
48933 48942 48951 48960 48969 48978 

GGA GCC TGC TCG CCT GCC TGC AGA GTT GGT GAC CCC ATG AAG AAC GAG CGT CCC 

GACSPA CRVGDP®KNERP 
EPARLPAEL VTP*RTSVP 
SLLAC LQSW*PHEERASR 
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RSPMRPQESMARRRV R G A 

// / / / ^ o / / / ' / o 

- -c ice ccc ^co^Aoc CO xAO^c^ oc. ™ .CO o.c^coc 

GTG CG^ CTG GGC ATT CTC GGC TGC TCC GAG ATC GCC CGA CGC CGT ACC CTG CCG 

V "r' 'l' 'g' "i 'l' 'g' "c" 's' D I a R R R T L P 

r^ G W AFSAAPTSPDAVPCR 
""a A G H S R L L R H R P T P Y P A G 

.SFT6SSVTVATAERLSS 
R A S P A P A S P S R R R R G S R P 
G R Q L H R L Q R H G G D G G P A L_ 

GAC Cic GGC cic gIc TGC i^^C^ C^G CGG^AGG GCC TCG^CTC 

GCC GCG CTG AAG GTG CCG GAG CTG ACG GTG ACC GCC GTC GCC TCC CGG AGC GAG 

T T 'l' 'k' v' T 'e' 'l T V t a V a S R S E 

% \ * R C R S * R * P P S P P G A R 
rn^R A E G A G A D G D R R R L P E R G 

T ARAT AARNPPSATTP* S 

C R G H P R R A T R R R P R R ^ S ^ 
V V G T R D G R P E A A L G D D A V_ 

iiG CGG -acl CGC^CAG C^ C^^^C 1.1 CCG^CCG cic CGG^CAG CAG CCG .TG 
GAC AAC^C CGT GCG GTC GCC GCG CGG TTC GGC GGC GAG GCC GTC GTC GGC . TAG 

"d" "n' "a" 'r" 'a" "7 T 'a" "r" "i "g "g "e" a V V G Y 
TTPVRSPRGSAARPSSA T 

o r p cgrravrr rgrrrlr 



» oQSLGSTSAT*Tt;KV,v x 
p"^ A A P S p H - R R P R R H G A W R 

R Q Q L A R I D V R D V D G Q _G 



- C^^OAC GAC CTC^TCG GGC CTA^CAG CTG CGC^CAG ATG CAG^AGG GAC GGG^TGG 
GAG GCG CTG CTG GAG AGC CCG GAT GTC GAC GCG GTC TAG GTC TCC CTG CCC ACC 

DVDAVYVSLPT 



RARMSTRSTSPCPP 



E A L L E S P 

RRGWR a : „ottjtpa 

G AAGEPGCRRGLRLPA-- 

S C W S Q I T R A R R ,. A P F C T S A 
V A G R S S R A R G A R P F A R A R 
S QVVVPDHAGQARSLV H^ E^ 

OCX oic oio oro ^ - -c^i - -^.^ -° 

GGA CTG^C CAC GAC TGG ATC GTG CGC GCC CTG CGC GCG GGA AAG CAC GTG CTC 
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D CTTTGSCAPCARESTCS 
TA PRLDRARPARGKARAR 

SFGSVAR*GSVTVATRRA 
PSAASRGSGPCRSPPG G R 
RLLRQGGAVRVGHRRDA E 

'roc CTC TTC GGC GAC TGG CGG GCG ATG GGC CTG TGG CAC TGC CGC CAG GCG GAG 
CGC CTC Ta^ ^^^^^ ^^^^^ ^^284 49293 49302 

GCG GAG AAG CCG CTG ACC GCC CGC TAG CCG GAC ACC GTG ACG GCG GTC CGC CTC 

RYPDTVTAVRL 



A E K P L T A 
\ ""a "a D R P L P G H R D G G P P R 



RSR *PPATRTP *RRSAS 



SERPRVSIS F RVKV WCES 

psgrgsaspsgsr*gasa 

R V G a . a Q R Q H L V Q G ^ _° _L _-- --- 

CGC CTG AGG GCG CCG gIc TGC GAC TAC CTC TTG GAC TGG AAG TGG GTC GTG AGC 
49311 49320 49329 49338 49347 49356 

^GCG GAC TCC CGC GGC CTG ACG CTG ATG GAG AAC CTG ACC TTC ACC CAG CAC TCG 

"d' T 'r" "g" T "7 "l' M E N L T F T Q H S 
■ R T P A A * R * W R T * P S P S T R 
GLPRPDADGEPDLHPA LA 

CSATRSISSS P PMPSSRE 
ARRRARSAPRPR CRHVA S 
Q V V G H A L H Q V L A A D T 

GAC G^G CTG C^ ^C GCG CTC TAC GAC CTG CTC CCG CCG TAG CCA CTT GAC GCG 
49365 49374 49383 49392 49401 49410 

CTG CAC GAC GCC GTG CGC GAG ATG CTG GAC GAG GGC GGC ATC GGT GAA CTG CGC 

"l' h' 'd' a' 'v' 'r E M L D E G G I G E L R 
CTTPCARCWTRAASVNCA 

ARRRA RDAGRGRHR*TAL 

V L S N P N G G S G G P L T R Y.W 
'■W G*WRTR. TGAVAERCRGTG 

G E GAL E P E R W Q - R ^ ^ ^ °_ / 

A^ GAG i~GG ill lie ill CCC AAG GGC GGT GAC GGA GGG CGG TTG CAG GCC ATG 
49419 49428 49437 49446 49455 49464 

TCC CTC ACC AGC GAG TTC GGG TTC CCG CCA CTG CCT CCC GGC AAC GTC CGG TAC 

's' "l' ~i~ 's~ 'e' 'f" 'g' F P P L P P G N V R Y 
PSPASSGSRHC.LPATSGT 
PHQRVRVP ATA SRQRPVP 

GSSAPPLRSSAPTYGSA A 
APAPRRCGAPRPRTDARR 
LR LQ GA A A QQVR A H I R 

GTC GGC CTC GAC CGG CCG CCG TCG GAC GAC CTG CGC CCG CAC ATA GGC GAG CGG 
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-49«7^3Si . ..-^ - 494^82:^: . :^ ' " 49500^ 41509 = 49Sr8 

CAG CCG GAG CTG GCC GGC GGC AGC CTG CTG GAC GCG GGC GTG TAT CCG CTC GCC 



QPELAGGSLLDAGVYPLA 
SRSWPAAACWTRACIRSP 
AGAGRRQPAGRGRVSARR 

ALMNRPGSRSTTPAVSRI 
PSCTGRARGRHPRPSAAS 
RRAHEEP6VEIHDPRRQP 

CGC CGC TCG TAG AAG GAG GCC GGG CTG GAG CTA GAC CAG CCC CGC TGC GAC GCC 
49527 49536 49545 49554 49563 49572 

GCG GCG AGC ATG TTC CTC GGG CCC GAC CTC GAT GTG GTC GGG GCG ACG CTG CGG 

a 'asmflgpdldvvgatlr 

RRACSSGPTSMWSGRRCG 

gehvprarprcgrgdaad 

PVS a ft STAPSAS SHAGS 

pfrp slrrppRRaath ar 

. HSGLRFDVHRAVRQQTRG 
X _ 

jfec CCT TGG CTC CGC TTT CAG CTG CAC CGC CCG CTG CGC GAC GAC ACA CGC GGG 
49581 49590 49599 49608 49617 49626 

ATG GGA ACC GAG GCG AAA GTC GAC GTG GCG GGC GAC GCG CTG CTG TGT GCG CCC 

MGTEAKVDVAGDALLCAP 
WEP RRKSTWRATRCCVR P 
GNRGESR RGGRRAAVCAR 

PRVACTDKPKSCA*RQ.AY 
RGCPVRTRR SRARRGSRT 
VAARCVH-GEAELVGVAA R 

CTG CCG GCG TGC CGT GTG CAC AGG AAG CCG AAG CTC GTG CGG ATG GCG ACG CGC 
49635 49644 49653 49662 49671 49680 

GAC GGC CGC ACG GCA CAC GTG TCC TTC GGC TTC GAG CAC GCC TAG CGC TGC GCG 



DGRTAHVSFGFEHAYRCA 
Ib'T AARHTCPSASSTPTAAR 
?ffR p -HGTRVLRLRARLP LRV 



VSHPLS PRIM T SRAKVGG 
CATPSRPGS*RRGHR *GA 
VRQ P P A L A P D D D V T G E G R 

ATG TGC GAC ACC CCC TCG CTC CCG GCC TAG TAG CAG CTG GCA CGG AAG TGG GGC 
49689 49698 49707 49716 49725 49734 

TAG ACG CTG TGG GGG AGC GAG. GGC CGG ATC ATC GTC GAC CGT GCC TTC ACC CCG 

~YTLWGSEGRIIVDRAFTP 
TRCGGARAGSSSTVPSPR 
HAVGERGPDHRRPCLHPA 

GSKRGVTRSSRASSTRSR 
ARSGGWPEAPVRRRPARA 
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GGC GGG CTG AAG GCG GGG TGC CAA GCC GAG CTT GCG CGG CTG CTC GAG GCG CTC 
49743 49752 49761 49770 49779 49788 

GCG GGC GAG TTG GGC GCG ACG GTT CGG CTG GAA GGG GGC GAG GAG GTG GGC GAG 



PPDFRPTVRLERADEVRE 
RPTSAPRFGWNAPTRCAS 
ARLPPHGSAGTRRRGAR J 

TRGASSWNAPVRAHKTRj 
RGAPRRGTRRCGRTSRG .P 
ADQRGV VLEGAGERAEDP 

GCG GAG GAG GGC CGG CTG CTG GTG AAG CGG CGG TGG GAG CGG ACG AAG GAG GCC 
49797 49806 49815 49824 49833 49842 

CGG GTG GTG CGG GCC GAG GAG GAG TTG GCC GGG ACG CTC GCG TGC TTG GTG CGG 

RVLPADDQFAGT LACFVR 
a'scrpt TSSP AP SRAS SG 
RPA G RR PVRRH P R V L R P C 

TVPPPDA A CLASTMARAI 
^J^^R *RRRTPPACR RH*RVPG 
/^*5^(G DGAAPRRRVAGIDDCPG 

CGG GAG TGG GCG CGG CGG AGG CGG CGG GTG TGG CGG CTA CAG TAG GGT GCG CGG 
49851 49860 49869 49878 49887 49896 

GCC GTG ACC GGC GGC GGG TGG GCG GCG GAG AGG GCC GAT GTG ATC GCA CGG GCC 

AVTGGG SAAHSADV I AR A 
PSPAAGRRRTAP MS SHG P 
RHRRRVGGAQRRCHRTGI 

NTL * TCPRARSSP LPQDI 
IPLDPA PGPVAARC RSTL 
SQYT L H LAP C PQ E A VA P * 

GGT AAC CAT TCA GTC GAG GTC GCG GCC GGT GCC GAC GAG CGG TTG CGG ACC AGT 
49905 49914 49923 49932 49941 49950 

4JCGA TTG GTA AGT CAG GTG CAG GGC CGG GCA CGG CTG CTC GGC AAC GGC TGG TCA 





-R L V S Q V Q G R A R L L G N G W S 
D W * VRCRAGHG CSAT AGQ 
IGKSGAGPGTAARQRLVI 

PASPRHARARERPQHSPl 
LLLHGI LALANEHSTPRP 
SSCIAS SR^SRTRTAP .PVP 

GGT GGT CGT CTA GCG GGT ACT GGC GCT CGG GCA AGA GCA GCG ACC ACC CTG CCC 
49959 49968 49977 49986 49995 50004 

GGA GGA GCA GAT GGC CGA TGA GCG CGA GCG CGT TCT CGT GGC TGG TGG GAC GGG 

GGADGR *ARARSRGWWDG 
EEQMAD ERERVL VA G^ GTG 
R S.R W P M S A S A F S W L ^v) G R C 
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RPGDATRPGSRPRLRPPP 
EHAT LQ A RVQGRGS GLHR 
NTPR*S HASRVAAPASTA 

CAA GCA CCC GGC AGT CGA CAC GCG CCT GGA CTG GCG CCG GCC TCG GCT CCA CCG 
50013 50022 50031 50040 50049 50058 

GTT CGT GGG CCG TCA GCT GTG CGC GGA CCT GAC CGC GGC CGG AGC CGA GGT GGC 

VRGPSAVRGPDRGRSRGG 
FVGRQL CADLTAAGAEVA 
SWAVSCART*PRPEPRWR 

SRGAPVPSGGAPGAGRGP 
RDGP PY RVEGQRAP EEDQ 
AIARRT GSKG RGPR SRT R 

CCG CTA GCG GGC CGC CCA TGG CCT GAA GGG GGA CGG CCC GGC CGA GGA GCA GGA 
50067 50076 50085 50094 50103 50112 

GGC GAT CGC CCG GCG GGT ACC GGA CTT CCC CCT GCC GGG CCG GCT CCT CGT CCT 

GDR PAGTGLPPAGPAPRP 
AIARRV PDFPLPGRLLVL 
./^^ RSP GGYRTSPCRAGS SSW 



R*WRTARPV PRRSRSRGG 
VDGGRR GPFQGVHDVGDA 
STVVADGPSSASTI SETR 

CCT GCA GTG GTG GCG CAG CGG GCC CCT TGA CCG GCT GCA CTA GCT GAG GCA GGC 
50121 50130 50139 50148 50157 50166 

gga cgt cac cac cgc gtc gcc cgg gga act ggc cga cgt gat. cga ctc cgt ccg 

grhhrvargtgrrdrlrp 
dv tt .as pgeladvi d svr 
t spprr p gnwpt * s t p s a 

acpp*rwrccspsrrvpc 
^^ rvrhdvgdaa vppdgfp v 
^' gcvttl ampllqpiasrs 

j^gg cgt gtg cca cca gtt gcg gta gcc gtc gtt gac ccc cta gcg gct tgc cct 

50175 50184 50193 50202 50211 50220 

CCC GCA CAC GGT GGT CAA CGC CAT CGG CAG CAA CTG GGG GAT CGC CGA ACG GGA 

PA HGGQRHRQQLGDRRTG 
PHTVVNAIGSNWGIAERD 
R T R W S T P S A A T G G S P N G T 

PSWSRPASGGG APRAAAS 
HLGVAR HRGA AQ QVRQPP 
MSVLQATGVRRRSSASRR 

GTA CCT CTG GTT GAC GCG CCA CGG CTG GGC GGC GGA CGA CCT GCG CGA CGC CGC 
50229 50238 50247 50256 50265 50274 

CAT GGA GAC CAA CTG CGC GGT GCC GAC CCG CCG CCT GCT GGA CGC GCT GCG GCG 
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METNCAVPTRRLLDALRR 
WRPTARCRPAACWTRCGi 



RTGDRRRGGRSLAPTRGS 
GRATGV DDVEA*HQLVAR 
VAHRG*TTWRPETSSYPG 

CTG GCG CAC GGC AGG GAT GCA GCA GGT GGA GCC GAG TCA CGA CCT CAT GCC GGG 
50283 50292 50301 50310 50319 50328 

GAG CGC GTG CCG TCC CTA GGT CGT CCA CCT CGG CTC AGT GCT GGA GTA CGG CCC 

D RVPSLRRPPRLSAGVRP 
TACRPYVVHLGSVLEYGP 
PRAVPTSSTSAQCWSTAI 

GARHVSGSRTAAGASSRi 
GRGTFRGPGRRRG PRRGG 
VGGP SGVRVADGGRGVVA 

CTG GGG CGG GCC ACT TGG CTG GGC CTG GCG CAG CGG CGG GGC CGG CTG CTG GCG 
50337 50346 50355 50364 50373 50382 

' GAC CCC GCC CGG TGA ACC GAC CCG GAC CGC GTC GCC GCC CCG GCC GAC GAC CGC 



^^'D PAR *TDPDRVAAPADDR 
TPPGEPTR TASPPRPTTA 
PRPVNRPGPRRRPGRRP] 

RCPWVRPSGPRAPPRRP] 
V ALGFERRALGHQLGGRL 
*PLALSAALWATS.SAAAS 

GAT GCC GTT CCG GTT TGA GCG CCG CTC GGT CCG GCA CGA CCT CCG GCG GCG CCT 
50391 50400 50409 50418 50427 50436 

CTA CGG CAA GGC CAA ACT CGC GGC GAG CCA GGC CGT GCT GGA GGC CGC CGC GGA 

LRQGQTRGEPGRAGGRRG 
YGKAKLAASQ AVLEAAAE 
^ TARP NSRRARPCWRPPR] 

jjf^ RRPPPRAAS RWRPRAPCC 
ADH LRAHQPDGVHG PR AG 
P T T S A P T S R I A L T A P G P V 

CCC GCA GCA CCT CCG CCC GCA CGA CGC CTA GCG GTT GCA CCG GCC CGG CCC GTG 
50445 50454 50463 50472 50481 50490 

- GGG CGT CGT GGA GGC GGG CGT GCT GCG GAT CGC CAA CGT GGC CGG GCC GGG CAC 

GRRGG GRAADRQRGRAGH 
G V V E A G V L R I A N, V A G P G T 
ASWRRACCGSPTWP GRA] 

PP*GARGPPRAARRPP*( 
RRDAQEAPHGPPEGLRDG 
GATLRSPRTAPRSASATV 



GGG CCG CCA GTC GGA CGA GCC GGC CCA CCG GCC CGC CGA GCG GCT CCG CCA GTG 
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5049^9-^ -- SOSO& ^ r 5(J5T7^ "^ * 50526*^ 50535 ^ 50544* 

CCC GGC GGT CAG CCT OCT CGG CCG GGT GGC CGG GCG GCT CGC CGA GGC GGT CAC 



PGGQPARPGGRAARRGGH 
P AV S L. L GR V A G R L A E A V T 
RRSACSAGWPGGSPRRSI 

PCAGPPRPATGTARGGRS 
PVHERRDHLQGLQAGVAV 
RSMSGATTSSDWNRAWR S 

GGC CCT GTA CGA GGG CCG CCA GCA CCT CGA CAG GGT CAA CGC GCG GGT GGC GCT 
50553 50562 50571 50580 50589 50598 

CCG GGA CAT GCT CCC GGC GGT CGT GGA GCT GTC CCA GTT GCG CGC CCA CCG CGA 

PGHAPGGRGAVPVARPPR 
RDMLPAVVELSQLRA HRD 
GTCSRRSWSCPSCAPTAI 

RRRARRRPRPAPRWGRG l 
V D V H A V D R V R H Q G G G A G T 
*TSTRSTESATSAA VRAR 

f^AT GCA GCT GCA CGC GCT GCA GAG CCT GCG CCA CGA CCG GCG GTG GGC GCG GGC 
if^^r'- 50607 50616 50625 50634 50643 50652 

CTA CGT CGA CGT GCG CGA CGT CTC GGA CGC GGT GCT GGC CGC CAC CCG CGC CCG 

LRRRARRLGRGAGRHPR^P 
YVDV RDVSDAVLAATRA^R 
TSTCAT SRTRCWPPPA>^ 



EPAPRGWRVRRPRAPA ^i 
NRPQDDGDSAALGHRHPP 
I GP S T T GM PRP S AT G T Rp:H 



ATA AGG CCC CGA CCA GCA GGG GTA. GCC TGC GCC GCT CCG GCA CGG CCA CGC, CAC 
50661 50670 50679 50688 50697 50706 

TAT TCC GGG GCT GGT CGT CCC CAT CGG ACG CGG CGA GGC CGT GCC GGT GCG- GTG 

YSGA GRPHRTRRGRAGAV 
^.-^ IPGLVVPIGRGEAVPVRW 



>^ F R G W S S P S D A A R P C R C G < 

RRDARRPSRRARRPGPAI 
EDIQEDLHAAHGGLDPLK 
S TSRSTST LPTGASTRSS 

CGA GCA GCT AGA CGA GCA GCT CCA CTC GCC GCA CGG GCG GCT CCA GGC CCT CGA 
50715 50724 50733 50742 50751 50760 

GCT CGT CGA TCT GCT CGT CGA GGT GAG CGG CGT GCC CGC CGA GGT CCG GGA GCT 

ARRSARRGERRARRGPGA 
LVDLLVEVSGVPAEVREL 
S S I C S S R * AAC P.P R S G S I 

RRRWPRPRPRS SGPRGRi 
GGGGRARGPVVPDLDVGP 
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AGG GCG GCG GCG GTG CCC GCG CCG GCC CCT GCT GAG CTA GGT CCA GCT GGG GCC 
50769 50778 50787 50796 50805 50814 

TCC CGC CGC CGC CAC GGG CGC GGC CGG GGA CGA CTG GAT CCA GGT CGA CCC CGG 



SRRRHGRGRG RLDPGRPR 
PAAATGAAGDDWIQVDPG 
PPPPRARPGTTGSRSTPC 

RGRVGRSSR RGSA ARTPS 
GGAFEEAPGGD. ARQVLRH 
GARSSRPQVATR E SCSDT 

CGG GCG GGC GCT TGA GGA GCC GAC CTG GCG GCA GGC GAG CGA CGT GCT CAG CCA 
50823 50832 50841 50850 50859 50868 

GCC CGC CCG CGA ACT CCT CGG CTG GAC CGC CGT CCG CTC GCT GCA CGA GTC GGT 

ARPRT PRLDRRPLAARVG 
PAREL L GWTAVRSLHE SV 
P P A N S S A G P P S A R C T S R 

RATPRC AACAPLGGA RPi 
_ 'G P Q P GV R Q AP L C D G L V R L 
'V PSHASVSRLCA IGWCAS 

CTG GCC CGA CAC CCG GCT GTG CGA CGC GTC CGT CCG TTA GGG GGT CGT GCG CCT 
50877 50886 50895 50904 50913 50922 

GAC CGG GCT GTG GGC CGA CAC GCT GCG CAG GCA GGC AAT CCC CCA GCA CGC GGA 

D RAV GRHAAQAGN P PARG 
T G LWAD T L RRQ A* I P Q H A E 
PGCGPTRCAGRQSPS TRi 

A. ATRPGTTL NGDAAGG A I 
R^PRGLGQR* I G T Q R A A R G 
G* RGD*ARDDSERRGRRGG 

I CGG CGC CGG CAG GAT CCG GGA CAG CAG TCT AAG GGC AGA CGG CGC GGC GGG CGG 
50931 50940 50949 50958 50967 50976 

MbeC GCG GCC GTC CTA GGC CCT GTC GTC AGA TTC CCG TCT GCC GCG CCG CCC GCC 



A A A V L^CyG P V V R F P S A A P P A 
P R P S ALSSDSRLPRRPP 
RG RPRP CRQIP VCRAAR] 



RASSPFEVVPGLPRRAFC 
GPPRRS NS SLA WRAARLA 
EPRV VP I RRCPGAPPACL 

GAG GCC CGC CTG CTG CCC TTA AGC TGC TGT CCC GGG TCG CCC GCC GCG CGT TTC. 

50985 50994 51003 51012 51021 51030 

CTC CGG GCG GAC GAC GGG AAT TCG ACG ACA GGG CCC AGC GGG CGG CGC GCA AAG 

LRADDGNSTTGPSG RRAK 
SG RTTG IR RQGPAG GAQS 
PGGRRE FDDRAQRAARKi 
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FARSQVAGSWVDGHGELH 
LRGLSSRVVGCTGTGRLT 
WVGSVPGCWEVRGRAG*P 



GGT TTG CGG GCT CTG ACC TGG CGT GGT GAG GTG TGC AGG GGC ACG GGG AGT TCC 
51039 51048 51057 51066 51075 51084 

CCA AAC GCC CGA GAC TGG ACC GCA CCA CTC CAC ACG TCC CCG TGC CCC TCA AGG 

PNARDWTAPLHTSPCPSR 
QTPETGPHH STRPRAPQG 
KR PRLDRTTPHVPVPLKV 

*RRGAARRRTRG CWRVGA 
DGGGPPVGGRVGAGASAQ 
TVAARRCAEAYARVLPRR 

ACA GTG GCG GCG GGC CGC CGT GCG GAG GCG CAT GCG GGC GTG GTC GCC TGC GGA 
51093 51102 51111 51120 51129 51138 

TGT CAC CGC CGC CCG GCG GCA CGC CTC CGC GTA CGC CCG CAC CAG CGG ACG CCT 

CHRRPAARLRV RPHQRTP 
VTAARRHASAY.A RTS GRL 
Jik^ SPPP GGTPPRTPAPADAC 



TRGAGRW .PSGARRSGAYR 
R GGPAVGPRVPEAL ARTG 
GDERR WALAFRSPSLGRV 

CGG CAG GAG GGC CGC GGT GCG GTC CCG CTT GGC CGA GCC GCT CTC GGG CGC-. ATG 
51147 51156 51165 51174 51183 51192 

GCC GTC CTC CCG GCG CCA CGC CAG GGC GAA CCG GCT CGG CGA GAG CCC GCG TAG 

AV LPAPRQGEPAR REPAY 
P S SRR HARANR L GE S P R T 
RPPGAT PGR TGSARARVP 

VPR*GASAS *RPTARRWS 
X SPDDGRRPQDAPRQGDGR 
PRTTVGG LSI LPANGTAV 

If^ 

^^CC TGC CCA GCA GTG GGG CGG CTC CGA CTA GTC GCC CCG CAA CGG GCA GCG GTG 
51201 51210 51 219 51228 51237 51246 

CGG ACG GGT CGT CAC CCC GCC GAG GCT GAT CAG CGG GGC GTT GCC CGT CGC CAC 

RTGRHPAEADQR GVA RRH 
GRVVTPPRLISGALPVAT 
DGSSPRRG*SAGR CPSPR 

A S A S G, Q S W P S R P T C L C I G 
PLHRARRGPAERRVSASA 
LCIGLGAVLPKEAYLPLH 



CTC CGT CTA CGG CTC GGG ACG CTG GTC CCC GAA GAG CCG CAT GTC TCC GTC TAG 
51255 51264 51273 51282 51291 51300 

GAG GCA GAT GCC GAG CCC TGC GAC CAG GGG CTT CTC GGC GTA CAG AGG CAG ATG 
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RQMPSPATRGFSAYRGRC 
GRCRALRPGASRRTEADA 

^ =^ 

L GAV L P KEAYL PV F N TR S 
SGQSWPSRPTCRFSTRGP 
RARRGPAERRVASRLEDQ 

GGC TCG GGA CGC TGG TCC CCG AAG AGC CGC ATG TCG CCT TGC TTC AAG GAG GAG 
51309 51318 51327 51336 51345 51354 

CCG AGC CCT GCG ACC AGG GGC TTC TCG GCG TAC AGC GGA ACG AAG TTC GTC CTG 

PSPATRGFSAYSG TKFVL 
RA LRPGASRRTAERSSSW 
EPCDQGLLGVQRNEVRPG 

PRDSPSA SSTASKPMLTS 
PGTRPARPRPRR SRC.*PA 
LAQGLPERVLDGVEADLH 

CTC CCG GAC AGG CTC CCC GAG CGC CTG CTC CAG CGG CTG AAG CCG TAG TTC CAC 
51363 51372 51381 51390 51399 51408 

^AG GGC CTG TCC GAG GGG CTC GCG GAC GAG GTC GCC GAC TTC GGC ATC AAG GTG 

^EGL.SE G LADEVADFG I KV 
RACPRGSRTRSPTSASRC 
GPVRGARG RGRR LRHQG A 

ITSGPEKRVESNSVPRAP 
S R R A P N R G C R A T R S P V P R 
QDDLRT GEA GRQELR S PG 

GAC TAG CAG CTC GGC CCA AGG AAG GCG TGG AGC GAC AAG CTC TGC CCT GCC CGG 
51417 51426 51435 51444 51453 51462 

CTG ATC GTC GAG CCG GGT TCC TTC CGC ACC TCG CTG TTC GAG ACG GGA CGG GCC 

L I VEP G SFRT S L F E T G RA 
*SSSRVPSAP RCSRRDGP 
D R R A G F L P H L A V R D G T G R 

ALVSLPRYGFTL RV. RPKT 
P W C P C- R G T- G S P -S G . S G R S R 
PGAR VAAQVRLHA P GAAE 

CCC CGG TCG TGC CTG TCG CCG GAC ATG GGC TTC CAC TCG GCC TGG GCG CCG AAG 
51471 ■ 51480 51489 51498 51507 51516 

GGG GCC AGC ACG GAC AGC GGC CTG TAC CCG AAG GTG AGC CGG AGC CGC GGC TTC 

GASTD S GLYPK VSRTRGF 
GPAR TAACTRR* AGPAAS 
GQ.HGQRPVPEG EPDPRLR 

EPPSPEW GPSGAFAAAS I 
RRRRR S GAR RGP S P P P A S 
DGAAVAGLG AV RRLRRRQ 



CAG AGG CCG CCG CTG CCG AGG GTC GGG CCG CTG GGC CGC TTC CGC CGC CGC GAC 
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51^525-- 5.1-534" 51543"' ' 51552' 51 56^1 • 51570 

GTC TCC GGC GGC GAG GGC TCC GAG GGG GGG GAG GCG GCG AAG GGG GGG GCG GTG 



VSGGDGSQPGDPAKAAAL 
SPAATAPSPATRRRRRR* 

L R R R R L P A R R P G E G G G A D 

RAASSASSVGSRSGNPSS 
GPRAPPPRSGAAAATPRR 

DQGRQLRVLGRQPQRQAV 

TAG GAG GGG GGC GAG CTC GGC GTG GTC TGG GGC GAG GCG GAG GGC AAC GCG GTG 
51579 51588 51597 51606 51615 51624 

ATC GTG GGC GCG CTG GAG GCG GAG GAG ACC GCG GTG CGG GTG CCG TTG GGC GAG 

I LAALEADETPLRLPLGD 
SWPRWRRTRPRCGCRWAT 
PGRAGGGRDPAAAAVGRR 

PTVATSP*RS*TRLSMVV 
RP* QRARDGRDPACRC*S 
PDSGHETVEILHAVVDR 



CTG CCG GAG TGA CGG GAG GAG CCA GTG GAG CTA GTC CAC GCG TTG CTG TAG TGG 
51633 51642 51651 51660 51669 51678 

GAC GGG GTC ACT GCG GTG CTC GGT CAC CTC GAT GAG GTG CGC AAC GAG ATC ACG 

DG VT AVLGHLDQVRND I T 
TG SLPCSVTSIRCATTSR 
RGHCRARSPR SGAQRHHD 

HSFRVLAVPKSSQPWRGR 
TPSASWPSPS RRSLGGAA 
RPLLPGPRRAEVVSAVPR 

TGG ACC CTC TTG GCG TGG TCC CGC TGG CCG AAG CTG CTG ACT CCG GTG GGC GGC 
51687 51696 51705 51714 51723 51732 

ACG TGG GAG AAG CGG ACC AGG GCG ACG GGC TTC GAC GAC TGA GGC CAC CGG CCG 

.^WEKRTRATGFpD*GHRP 
*'R G R- S G P G R R A S T T E A T G R 

VGEADQGDG LRRLRP PAA 

L LP QPAGFGGGVRAEMS S 
CFLNPPASD AG. * GRKWPP 
AFSTP PRR IRGRGESGHL 

GCG TTT TCT CCA ACC CCG CGC GGC TTA GGC GGG GGA TGG GAG CGA AGG TAG CTC 
51741 51750 51759 51768 51777 51786 

CGC AAA AGA GGT TGG GGG GCG CCG AAT CCG CCG CCT ACC CTC GCT TCC ATG GAG 

RKRGWGAPNPPPTLASME 
AK EVGGRRIRPLPSLPWR 
QKRLGGAESAPYPRFHGG 

SCLTQSTLSPM*AVCSCA 
LASRRPLLARCRRWAPVP 
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CTT CTC GTC TCG CAG ACC CTT CAT TCC GAG CCG TAG ATG CGG TGC GTC CTT GTC 
51795 51804 51813 51822 51831 51840 

G7^ GAG CAG AGC GTC TGG GAA GTA AGG CTC GGC ATC TAC GCC ACG CAG GAA CAG 

EEQSVWEVRLGIYATQEQ 
KSRASGK*GSASTPRRNR 
RAERLGSKARHLRHAGTG 

SSILSC ITLSRQGSGS*A 
PRS*PVSR*AGRGPGRDR 
RVLDLFLDDPEEARVGIV 

CGC CTG CTC TAG TTC CTT GTC TAG CAG TCC GAG GAG ACG GGC CTG GGG CTA GTG 
51849 51858 51867 51876 51885 51894 

GCG GAC GAG ATC AAG GAA CAG ATC GTC AGG CTC CTC TGC CCG GAC CCC GAT CAC 

ADE IKEQI VRLLCPDPDH 
RTRSRNRSSGSSARTPIT 
GRDQGTDRQAPLPGP RSR 



|t|b/G GQGTGHDTMISRSQSAY 

'"gargpgttp*saarsrrt 
grgardrprdhhqavavr 



CGG GGC GGG ACG GGC CAG GGC ACC AGC CAG TAC TAC GAC GCG CTG ACG CTG CGC 
51903 51912 51921 51930 51939 51948 

GCC CCG CCC TGC CCG GTC CCG TGG TCG GTC ATG ATG CTG CGC GAC TGC GAC GCG 

APPCPVPWSVMMLRDCDA 
PRPARSRGR S*CCATATR 
PALPGPVV GHDAARLRR V 

GSSRSCALISCSRQAPRD 
DPVAPAPWSRVPGNLRGI 
IRFQPLLGPDFLVTSGAS 

^^^TA GGC CTT GAC GCC CTC GTC CGG TCC TAG CTT GTC CTG GCA ACT CGG CCG GCT 
51957 51966 51975 51984 51993 52002 

TAT CCG GAA CTG CGG GAG CAG GCC AGG ATC GAA CAG GAC CGT TGA GCC GGC CGA 

Y PE LREQAR IEQDR*AGR 
IRNCGSRPGSNRTVE .PAD 
S GTAGAGQDRTGPLS RPI 

RGEVPRSPRPGGALRRLA. 
EAKLRDAQ GLAGRSGVYL 
RPR*GTPKASPGGRASTS 

AGA GCC GGA AGT TGG CCA GCC GAA CCG GCT CCC GGG GGG CGC TCG GCT GCA TCT 
52011 52020 52029 52038 52047 52056 

TCT CGG CCT TCA ACC GGT CGG CTT GGC CGA GGG CCC CCC GCG AGC CGA CGT AGA 

SRPSTGRLGRGPPASRRR 
LG LQPVGLAEGPPRADVE 
SAFNR SAWPRAP REPT * S 
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PLHESPPRDDPDGPMGRV 
PCTNARRGITLTAPCGAC 
RAPTREAASR*PRRADRA 

CGC CCG TCC ACA AGC GAG CCG CCG GCT AGC AGT CCC AGC GGC CCG TAG GGC GCG 
52065 52074 52083 52092 52101 52110 

GCG GGC AGG TGT TCG CTC GGC GGC CGA TCG TCA GGG TCG CCG GGC ATC CCG CGC 

AGRCSLGG RSSGSPGIPR 
RAGVRSAADRQGRRA SRA 
GQVFAR RPIVRVAGHPAH 

LRRHSGRGPPLIRSRPSL 
WGD IRGGGPHCSAPV RHS 
GATSAVGARTAPHPFATL 

TGG TCG GCA GCT ACG CTG GGG GCG GGC CCA CCG TCC TAC GCC CTT GCG CCA CTC 
52119 52128 52137 52146 52155 52164 

ACC AGC CGT CGA TGC GAC CCC CGC CCG GGT GGC AGG ATG CGG GAA CGC GGT GAG 

S^RRCDPRPGGR (m) R E R G E V/ J(LL 
flpp AVDATPARVAGCGNAVR -^"^ / 
^^QPSMRPPPGWQDAG TR*E 



PPP AIPRLSRSATARPPR 
P R P R S P A S H A P P P p G P R A 
PAP ARHPPTLPLRHGPA .P 

TCC CCG CCC CCG CGC TAC CCC GCC TCA CTC GCC CTC CGC CAC CGG GCC CCG CCC 
52173 52182 52191 52200 52209 52218 

AGG GGC GGG GGC GCG ATG GGG CGG AGT GAG CGG GAG GCG GTG GCC CGG GGC GGG 

RGGGAMG RSEREAVARGG 
GAGAR WGGVSGRRWPGAG 
GRGRDGAE*AGGGGPGRA 

S*SAACATTSS *ARATSA 
^^^^A ERPPAPPPR RDRVRRRP 
^p|> KVLRRLRHDV IVCAGDL 

GCC GAA GTG CTC CGC CGC GTC CGC CAC CAG CTG CTA GTG CGT GCG CGG CAG CTC 
52227 52236 52245 52254 52263 52272 

CGG CTT CAC GAG GCG GCG CAG GCG GTG GTC GAC GAT CAC GCA CGC GCC GTC GAG 

RLHEAAQAVVDDHARAVE 
GFTRRRRRWSTI THAPSR 
ASRGG AGGGRRSRTRRRG 

TRAARSGIWSCSARRSSS 
RVPPGPVSGHAVPGARAP 
GY PRGQFR DMLLQGPALQ 

CGG CAT GCC CGC CGG GAC CTT GGC TAG GTA CTC GTT GAC CGG GCC GCG CTC GAC 
52281 52290 52299 52308 52317 52326 

GCC GTA CGG GCG GCC CTG GAA CCG ATC CAT GAG CAA CTG GCC CGG CGC GAG CTG 
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PYGRPWNRSMSNWPGASW 
RTGGPGTDP*ATGPARAG 

TMGTARSDSRVSPLSRRp 
P*GPPGATPG*RPCAAGP 
LDDRHGPQRVEG LAPQAQ 

CTC GAG TAG GGC CAC CGG GCC GAG AGO CTG GAG TGG CTC COG TCC GAG GCG GAG 
52335 52344 52353 52362 52371 52380 

GAG GTC ATC CGG GTG GCC CGG CTG TCG GAG CTC ACC GAG GGC AGG CTG CGC CTG 

EVI.PVARLSDLTEGRLRL 
RSSRWPGCRTSPRAGCAW 
GHPGGPAVGPH RGQAAPG 

STSFP P NRVTP WTSSAPE 
PPPSPRTGSPRGPARRRS 
PLHLLAPEPRDALHEVGA 

CCC CTC CAC CTC TTC CCG GCC AAG GCC TGC GAG CCG GTC CAC GAG CTG CGG CCG 

» 52389 52398 52407 52416 52425 52434 
b GAG GTG GAG AAG GGC GGG TTC CGG ACG GTC GGC CAG GTG CTC GAG GCC GGC 
p . 

GEV.EKGGFRTVGQVL DAG 
GRWRRAGSGRSARCSTPA 
GGGEG RVPD GRPGARRRL 

YRSRWSRPTPCCVASWVT 
TGAAGAGRPRAASRRGSP 
R V P Q A L E A P D P L L G G V L R 

AGG ATG GCC GAG GCG GTC GAG GCG CCC CAG CCC GTC GTC TGG CGG CTG GTC TGC 
52443 52452 52461 52470 52479 52488 

TCG TAG CGG CTG CGC CAG CTC CGC GGG GTC GGG CAG CAG ACC GCC GAC CAG ACG 

SYRLRQLRGVGQQTADQT 
RTGCAS S AGSGSRPPTRR 
VPAAPAPRGRAADRRP DG 

" AAAWR I A S A T R S L M A T C M 

P R R G A S R R P Q V P C C R R V C 
HGGGLPDGLSYPVADGYV 

CAC CGG CGG CGG GTC GCC TAG CGG CTC CGA CAT GCC CTG TCG TAG CGG CAT GTG 
52497 52506 52515 52524 52533 52542 

GTG GCG GCC GCC CAG CGG ATC GGC GAG GCT GTA CGG GAC AGC ATC GCC GTA CAC 

VAAAQRIA EAVRDSIAVH 
WPP PSGSPRLYGTASPYT 
GRRPA DRRGCTGQHRRTH 

STSLGSGRVVASTTASCT 
RRPCARAGSWRVP RRAAR 
DVHVPGLGPGGCQDDRQV 



TAG CTG CAC CTG TCC GGG CTC GGG GCC TGG TGG CGT GAC CAG CAG CGC GAC GTG 
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52551^:* 52560- 52569^ ' ' 3257B^ 525S7 ' 52596 

ATC GAC GTG GAG AGG CCC GAG CCC CGG AGO ACC GCA CTG GTC GTC GCG CTG GAG 



IPVDRPEPRTTALVVALH 
STWTGPSPGPPHWSSRCT 
RRGQARAPDHRTGRRAAI 

STSAPGSARRATSAPPA5 
APPPPGRP VGPRRPPRPA 
HQHLRAGLCAPGDLRAPR 

GAG GAG GAC CTG CGG GCG GGG CTG CGT GCG GCG CGG CAG CTG CGC CGG CCC CGC 
52605 52614 52623 52632 52641 52650 

GTG CTG GTG GAG GCG GGC CCC GAG GCA CGC CGG GCG GTC GAG GCG GGC GGG GCG 

VL VEAGPEARRAVEAGGA 
CWWRRAPR HAGP SRRAGR 

AGGGGPRGTPGRRGGRG/ 

VFFSPGSSASAPGAA PRS 
SS SARGAAPRPPAPPLGA 
ORLLEARQQGLRPRRCAP 



j^C TGC TTC TTC GAG . CCG GGC GAC GAC CGG GTC CGC CCC GGC CGC CGT CGG GCG 
' y 52659 52668 52677 52686 52695 52704 

CTG ACG AAG AAG CTG GGC CCG CTG CTG GCG GAG GCG GGG CCG GCG GCA GGC CGG 

LTKKLGPLLAEAGPAAG R' 
*R RS SARCWPRRG RRQ AG 
D E E A R P AA GR G G A G GR P Js 

RMSNAP RAARPRASAAT is 
A C A T R P A P R V P V P A P P R P 
Q AH Q E R P P G C P S P R Q R GH: 

GAC GCG TAG GAC AAG CGC CCC GGC CGG CGT GCG CGT GCG CGC GAC CGC CGG CAC 
52713 52722 52731 52740 52749 52758 

CTG CGC ATG CTG TTC GCG GGG CGG GCG GCA CGG GGA CGG GCG CTG GCG GCG GTG 

^tft/ RMLFAGRAARGRALAAV 

'"yiC ACCSRGGPHGDGRWRP W 
A H A V R G A G R^ T G T G A G G R G 

SIR ASVSCAS'WSP TGGSS 
PSGRVSRAPRGRRHAVAA 
RLDACQGLLGVVVTHWRQ 

CGC CTG TAG GCG CGT GAC TGG GTC GTC CGG CTG GTG CTG CCA CAC GGT GGC GAC 
52767 52776 52785 52794 52803 52812 

GCG GAG ATC CGC GCA CTG ACC GAG CAG GCG GAC CAC GAC GGT GTG CCA CCG CTG 

AEIRALTEQADHDGVPPL 
RRSAH*PSRPTTTVCHRC 
GDPRTDRAGRPRRCATAA 

AWA ETSRSRRGPESTA 'AR 
RGPRPRGAAGGP SRPPRG 
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GAG CGG GTC CGG AGC CAG CTG GAG GAG GCG GCG GGC CCG AGG CTC GAG CGG CGG 
52821 52830 52839 52848 52857 52866 

CTC GCC CAG GCC TCG GTC GAC CTG CTG CGG CGC CCG ■ GGC TCC GAG GTG GCG GCG 

LAQASVDLLRRPGSEVAA 
SPRP RS TCCAARAPRWPP 
RPGLGRPAAPPGLRGGRP 

TSKSSREAS Y*PRSASSE 
PRSRAA SRRT S. RG ARRAR 

QDVELQAGGLVVAQEGLE 

GAC CAG CTG AAG CTC GAC GCG AGG CGG CTC ATG ATG CCG GAC GAG CGG CTC GAG 
52875 52884 52893 52902 52911 52920 

CTG GTC GAC TTC GAG CTG CGC TCC GCC GAG TAG TAG GGC CTG CTC GCC GAG CTC 

LVDFELRSAEYYGLLAEL 
W S T S S CAPPS TTAC S P S S 

GRLRAALRRVLRPARRAL 

-^jj^ PRAGSGAAASPNRGSSTA 
i*P' P GRGR GRPPRPTGAPRPP 
RA A GGVGRRGLPEQRVL H 

AGC CCG GCG CGG GGG CTG GGG CGC CGC CGG CTC CGC AAG GAC GGC CTG CTC CAC 
52929 52938 52947 52956 52965 52974 

TCG GGC CGC GCC CCC GAC CCC GCG GCG GCC GAG GGG TTC CTG CCG GAC GAG GTG 

SGRAPDPAAAEGFLPDEV 
RAA P P T PRR P RG S C R T RW 
G P R P R P R G G R G V P A G R G G 

SRTLVWASSSVCRRTESR 
RAP * SGPARR CAGGPRV A 
GLPDPGLREVVRVAPD*Q 

CGG CTC GCC CAG TCC TGG GTC CGC GAG CTG CTG TGC GTG GCG GCC CAG AGT GAC 
£ljm] 52983 52992 53001 53010 53019 53028 




^pf^CC GAG CGG GTC AGG AGC CAG GCG CTC GAC GAC ACG CAC CGC CGG GTC ^TCA CTG 

AERVRTQALDDT HRRVSL 
PSGSGPRR STTRTAGSHC 
RAGQDPGARRHAPPGLTA 

P*WAKPV RKARAWRRVIR 
R S G P R R C G S R G R G. A G S S G 
AAVLGEAGAEGEGLAPRD 



GCG CCG ATG GTC CGG AAG CCG TGG GCG AAG CGG GAG CGG GTC GCG GCC TGC TAG 
53037 53046 53055 53064 53073 53082 

CGC GGC TAG CAG GCC TTC GGC ACC CGC TTC GCC CTC GCC CAG CGC CGG ACG ATG 



RGYQAFGTRFALAQRRT I 
AATRPSAPASPSPSAGRS 
RLPGLRHPLRPRPAPDDP 
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P S S I P S P LY I WAMAA S AC 

RRRSPAR CSSGPWRRVRA 
E A V L H P E A L R D L G D G C E R 

GAG CCG CTG CTC TAG CCC GAG CCG TTC TGC TAG GTC CGG TAG CGG CGT GAG CGC 
53091 53100 53109 53118 53127 53136 

CTC GGC GAC GAG ATG GGG CTC GGC AAG ACG ATC CAG GCC ATC GCC GCA CTC GCG 

LGDEMGLGKTIQAIAALA 
SATRWGSARRSRPSPHSR 
RRR D GA RQD D P GH R RT RA 

RA AS PCLWKMTTQGALTS 
GLR .RPASGS*PPRDPWRA 
V*GGLPLAVEHHDTRGA H 

GTG GAT CGG CGG CTC CCC GTC TCG GTG AAG TAC CAC CAG ACA GGC CGG TCG CAC 
53145 53154 53163 53172 53181 53190 

CAC CTA GCC GCC GAG GGG CAG AGC CAC TTC ATG GTG GTC TGT CCG GCC AGC GTG 



: LAAEGQSHFMVVCPASV 

jj0T *PPRGRATSWWSVRPAC 
^Jfr PSRRGAEPLHGGLSG QRA 



IL QVRSVSFRLTSRTVGS 
S*SSGPSRSACHAARSVA 
QDVPGPLGLLA THQAHCR 

GAC TAG TTG ACC TGG GCC CTC TGG CTC TTC GCG TCA CAC GAC GCG CAC TGT GGC 
53199 53208 53217 53226 53235 53244 

CTG ATC AAC TGG ACC CGG GAG ACC GAG AAG CGC AGT GTG CTG CGC GTG ACA CCG 

LINWTRETEKRSVLRVTP 
*ST GPGRPRSAVCCA*HR 
DQLDPGDREAQCA ARDTA 

C P G S R C SANA S Q F P RP P T 
ARGRGAP RTRRS SPA PRR 
^afl^ VAGVPLVREGVPLPPAA 



5^ - - - 

GAC GTG CCG GGG CTG GCC GTC CTG CGC AAG CGG CTG ACC TTC CCC GCC CCG CCG 
53253 53262 53271 53280 53289 53298 

CTG CAC GGC CCC GAC CGG CAG GAC GCG TTC GCC GAC TGG AAG GGG CGG GGC GGC 

LHGPDRQDAFADWKGRGG 
C T A P T G R TR S P T GR G GAA 

ARPRPAGRVRRLEGAGRR 

ATVVKSASRPKGAGPPPS 
RP*WRRRAAPSGPARPRR 
DRDGGEVRQPAERRGPAA 

CAG CGC CAG TGG TGG AAG CTG CGC GAC GCC CCG AAG GGC CGC GGG CCC CCG CCG 
53307 53316 53325 53334 53343 53352 

GTC GCG GTC ACC ACC TTC GAC GCG CTG CGG GGC TTC CCG GCG CCC GGG GGC GGC 



-208- 



SRSPPSTRCGASRRPGAA 
RGHHLRRAAGLPGARGR] 

TPMSTTSSAW *TFFGRV] 
PPCARRPRPGSRSSDGSG 
LHAHEDHVLGVVHLIGPG 

CTC CAC CCG TAG GAG GAG CAC CTG CTC CGG GTG ATG CAC TTC TTA GGG GCC TGG 
53361 53370 53379 53388 53397 53406 

GAG GTG GGC ATG CTC GTC GTG GAC GAG GCC CAC TAG GTG AAG AAT CCC CGG ACC 




GCG GCG AGG TAG CGG CAG AGG CTC ACC CGC CTC GTG ACG CTG GCG CAC GAC AAG 
^^.j 53415 53424 53433 53442 53451 53460 

C^C CGC TCC ATG GCC GTC TCC GAG TGG GCG GAG CAC TGC GAC CGC GTG CTG TTC 



RRSMAVSEWAEHCDRVLF 
A A P W P S P S G R S T A T A C C S 
PLHGRLRVGGALRPRA V3 

VPVGMSFRTSSNRLRTR] 
SRYAWPSGRRPTGCGPAS 
QGTRGHLV ADLLEAAQH P 

GAC TGG CCA TGC GGG TAG CTC TTG GCG CAG CTC CTC AAG GCG TCG GAC CAC GCC 
53469 53478 53487 53496 53505 53514 

CTG ACC GGT ACG CCC ATG GAG AAC CGC GTC GAG GAG TTC CGC AGC CTG GTG CGG 

LTGTPMENRVEEFRSLV R 
* PVRPWRTASRS SAAWCG 
DRYAHGEPRR GVPQPGAE 

P?*RWGS SASAMSS CSP.T APi 
G G A R A P P P W R R A R R R p p S 
DELGLQRL GDVLVVAHRA 



TAG GAG GTC GGG CTC GAC CGC CTC CGG 
53523 53532 53541 

ATG CTC CAG CCC GAG CTG GCG GAG GCC 



TAG CTG CTC GTG CTG CCG CAC CGC CCG 
53550 53559 53568 

ATC GAC GAG CAC GAC GGC GTG GCG GGC 




AGG TTC CGC AAG GCG TTC CGC CAG CGT GGC CAG ATA GAC GCG GCG TTG GTC GTC 
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53577^- 53586' ' 53595-' ' - 5360r 53613" 53622 

TCC AAG GCG TTC CGC AAG GCG GTC GCA CCG GTC TAT CTG CGC CGC AAC GAG GAG 



SKAFRKAVAPVYLRRNQQ 
PRRSARRSHRSI GAATSR 
QGVPQGGRTGLSAPQPAG 

TRVSSGASWCVS SHSS GL 
RG*RVGPAGACPRTPPAW 
VDEGFERREL VRVLPLLG 

CTG GAG GAG TGG CTT GAG GGC CGC GAG GTC GTG TGC CTG CTG ACC GTC CTC GGG 
53631 53640 53649 53658 53667 53676 

GAC GTC CTC ACC GAA CTC CCG GCG CTC GAG CAC ACG GAG GAG TGG GAG GAG CCC 

DVLTELPALQHTDE WEEP 
TSSPNSRRSS TRTSGRSP 
RPHRTPGAPAHGRVGGAQ 

VASSSA*RSATRAPLKMA 
CP PRPPR GRPRARRCS *P 
:^,A, RRVLLGVALGHAGAVEH 

gg: 

#i?TCG TGC CGC CTG CTC CTC CGG ATG GCG CTC CGG CAC GCG CGG CCG TTG AAG TAG 
53685 53694 53703 53712 53721 53730 

AGC ACG GCG GAC GAG GAG GCG TAG CGC GAG GCG GTG CGC GCG GGC AAC TTC ATG 

STADEEAYREAVRAGNFM 
ARRTRRPT ARPCAP AT S W 
HGGRGGLPRGRARRQLH 6 

IRLAAYAR GSRDAFTCRS 
SACPPTRADPATRSPAGA 
RHAP .RRVRTRLPGRLHVP 

CGC TAG GCG TCC CGC CGC ATG CGC GCA GGC CTC GGC AGG CGC TTC CAC GTG GCG 
53739 53748 53757 53766 53775 53784 

GCG ATG CGC AGG GCG GCG TAG GCG CGT CCG GAG CGG TCC GCG AAG GTG CAC CGG 

jHf^ MRRAAYARPERSAKVHR 
>^5^'r -CA GRR TRVR S G P R R C T. G 
' d A Q G G V R A S G A V R E G A P A 

RSIASSA ASFPSFTTTNE 
ARSRQPPRRSRASPRPTR 
QALDSLLGGLVPQLDHHE 

GAC GCG CTC TAG CGA CTC CTC CGG CGG CTC TTG CCC GAC TTC CAG CAC CAC AAG 
53793 53802 53811 53820 53829 53838 

CTG CGC GAG ATG GCT GAG GAG GCC GGC GAG AAC GGG CTG AAG GTC GTG GTG TTC 

LREIAEEAAENGLKVVVF 
CARSLRRP PRTG*RSWCS 
ARDR * GGRR ERA E GRGVL 

ANRSTSATTRSASVSAAP 
RTGPRVPLPVRPA*PRPR 
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AGG CGC AAG GCC CTG CAT GAG CGT CAC CAT GCG CTC CGC GAG TGC CTG CGC CGG 
53847 53856 53865 53874 53883 53892 

TCC GCG TTC CGG GAC GTA CTG GCA GTG GTA CGC GAG GCG CTC ACG GAC GCG GCC 

SAFRDVLA VVREALTDAA. 
PRSGTYWQWYARRSRTRP 
RVPGRTGSGTRGAHGRGR 

GPAS AP GCS SGPDSSPRA 
A L P P L L GAPRA P TR L P AL 

PWP -RFCARLVLRPGFLPS 

CCC GGT CCC CGC CTT CGT CCG GGC GTC CTG CTC GGC CCC AGG CTT CTC CCC GCT 
53901 53910 53919 53928 53937 53946 

GGG CCA GGG GCG GAA GCA GGC CCG CAG GAC GAG CCG GGG TCC GAA GAG GGG CGA 

GPGAEAGPQDEPGSEEGR 
GQGRK QARRTSRGPKRGE 
AR GGS RPAGRAGVRRGAS 

VASAR PGATSLAAVGSVG 
WLPHAPGPPPFPLWAPCA 
GCRIRPARRHFPCGRRVR 

CGG TGT CGC CTA CGC GCC CCG GGC CGC CAC CTT TCC CGT CGG TGC GGC CTG TGC 
53955 53964 53973 53982 53991 54000 

GCC ACA GCG GAT GCG CGG GGC CCG GCG GTG GAA AGG GCA GCC ACG CCG GAC ACG 

ATADARG PAVERAATPDT 
PQRMRGARRWKGQPRRTR 
HSGCAG PGGGKGSHAGHA 

PWSS lAATRSVGAGVSRV 
PGPPSRRRVPCVPA SPAS 
RALLLDGGYPVCRRRRLP 

GGC CCG GTC CTC CTC TAG CGG CGG CAT GCC CTG TGT GGC CGC GGC TGC CTC GCC 
r 54009 54018 54027 54036 54045 54054 

:-CCG GGC CAG GAG GAG ATC GCC GCC GTA CGG GAC ACA CCG GCG CCG ACG GAG CGG 

PGQEEIAAVRDTPAPTE .R 
RARRR S PPYG THRRRR SG 
GPGGDRRRTGHTGADGAD 

PGRLTGPGRAPRTNPGIE 
PAACPAPVAPRAHTRA SR 
RPRAPHRSRP GPTHEPRD 

TGC CCC GGC GCG TCC CAC GGC CCT GGC GCC CGG CCC GCA CAC AAG CCC GGC TAG 
54063 54072 54081 54090 54099 54108 

ACG GGG CCG CGC AGG GTG CCG GGA CCG CGG GCC GGG CGT GTG TTC GGG CCG ATC 

TGPRRVPGPRAGRVFGP I 
RGRAGCRDRGPGVCSGRS 
GAAQGAGTAGRACVRADL 
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PLTG GARRCCSTSSKAAA 
PCRAARGGVAARRRSRRR 
RA AHRGGASLLE^DVVEGG 

AGO CCG TCG CAC GGC GGG CGG GCG GCT GTC GTC GAG CAG CTG CTG AAG CGG CGG 
54117 54126 54135 54144 54153 54162 

TCG GGC AGC GTG CCG CCC GCC CGC CGA CAG CAG CTC GTC GAC GAC TTC GCC GCC 

SGSVP PARRQQLVDDFAA 
RAACRP PADSSS STTSPP 
G Q R A A R PPTAARRRLRRR 

GP*ATSSACISAPPTPRL 
ARDRRVARASRPLRL PG* 
RGTVGYQERLDLCASHAE 

CGC GGG CCA GTG CGG CAT GAC GAG CGC GTC TAG CTC CGT CCG CCT CAC CCG GAG 
54171 54180 54189 54198 54207 54216 

GCG CCC GGT CAC GCC GTA CTG CTC GCG CAG ATC GAG GCA GGC GGA GTG GGC CTC 

•^/-/AX PGHAVLLAQIEAGGVGL 
Mp^R PVT PYCSRRSRQAEWAS 
ARSRRTARADRGRRSGPQ 

MCAAETTIRQ SGCSLGVT 
CA PRRRPSGRRAAA*ASR 
VHLGGGH HDEALRLELRG 

TTG TAC GTC CGG CGG AGG CAC CAC TAG GAG ACG CTC GGC GTC GAG TTC GGC TGG 
54225 54234 54243 54252 54261 54270 

AAC ATG CAG GCC GCC TCC GTG GTG ATC CTC TGC GAG CCG CAG CTC AAG CCG ACC 

NMQAASVVI LCEPQLKPT 
TCRPPPW*SSASRSSS R P 
HAGRLRGDPLRAAAQAD R 

SCWATARAWRMPWTRETR 
^ RVG P P R GHGGC P G P G S P G 
F V L R D GT GVA H A L D A R D 

CAG CTT GTG GTC CGC CAG CGG GCA CGG GTG GCG TAC CCG GTC CAG GCG AGC CAG 
54279 54288 54297 54306 54315 54324 

GTC GAA CAC CAG GCG GTC GCC CGT GCC CAC CGC ATG GGC CAG GTC CGC TCG GTC 

VEHQAVARAHRMGQVRSV 
SNTRR SPVPTAWARSAR S 
RTPGGRPCPPHGPGPL GP 

TCRR SQVSPTSSRRTRI S 
RAGGARCPLPPRVGPASA 
AHVAQEARFPHVFAQHPH 

GCG CAC GTG GCG GAC GAG ACG TGC CTT CCC CAC CTG CTT GCG GAC CAC GCC TAC 
54333 54342 54351 54360 54369 54378 

CGC GTG CAC CGC CTG CTC TGC ACG GAA GGG GTG GAC GAA CGC CTG GTG CGG ATG 
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ACTACSARKGWTNAWCGC 
RAPPALHGRGGRTPGADi 

SFLDRRNSA*ARRLATAJ 
PSCTG GTRRKRGGCRPRR 
QLVLGAQEVSVGAAARDG 

GAG CTC TTG TTC AGG GCG GAG AAG CTG CGA ATG CGG GCG GCG TCG CGC GAG CGG 
54387 54396 54405 54414 54423 54432 

CTG GAG AAC AAG TCC CGC CTG TTC GAG GCT TAG GCG CGC CGC AGG GCG GTC GCG 

LENKSRLFDAYARRSAVA 
WRTSPACSTLTPAAARSP 
GEQVPPVRRLRPPQRGRI 

DVGSATSMESRARARWM^ 
TSVPRRRCR PGRGPGGCR 
LRCRVGDVDRVEGQGAVD 

CTC AGC TGT GGC CTG CGG GAG CTG TAG AGG CTG GAG CGG GAC CGG GCG GTG TAG 
54441 54450 54459 54468 54477 54486 

jp||iG TCG ACA CGG GAC GCG GTC GAC ATG TCG GAC CTC GCG CTG GCG CGC CAC ATC 

E STPDAVDISDLALARHI 
SRHRT PSTSRTSPWPATS 
VDTGRRRHLGPRPGPPHI 

SSSCARNPAHTGTAAGII 
PPPVPVTPPTLEPRRA* E 
HLLFL CPQPRSNRDGRR N 

CAC CTC CTC CTT GTC CGT GCC AAC CCC CGC ACT CAA GGC GAG CGG CGC GGA TAA 
54495 54504 54513 54522 54531 54540 

GTG GAG GAG GAA GAG GCA CGG TTG GGG GCG TGA GTT CGG GTC GCC GCG CGT ATT 

VEEEQA RLGA*VPVAAPI 
WRRNRHGWGREFRSPRLF 
GGGTGTVGGVS S GRRAY S 

H H R L H L G A L R H P Q G.P P H I 
T T A S T F A R W A T P S V Q L T P 
PPPPPSPGGPPPASRS PP 

GCC AGC ACC GCC TCC ACT TCC GGG CGG TCC GCC ACC GCG ACT GGA CGT CCC ACC 
54549 54558 54567 54576 54585 54594 

CGG TGG TGG CGG AGG TGA AGG CCC GCC AGG CGG TGG GGC TGA CGT GGA GGG TGG 

RWWR R * RPARRWG * P GGW 
GGGGGEGPPGGGADLEGG 
VVAEVKARQAVGLTWRVC 

RRGPHEQLRPHPHHPPLI 
GDEPTNKSDRIHITHPCL 
ATKRPTRPTASTSPTPAS 



GCG GCA GAA GGC CCC ACA AGA ACC TGA GCG CGT ACA GCT ACC ACA CCC CGG TCT 
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5460'3- ^ ^ 54612 ^ 54 621 =^ - 54630 54639 * 54648 

GGC CGT CTT CCG GGG TGT TCT TGG AGT CGC GGA TGT GGA TGG TGT GGG GGC AGA 



GRLPGC .SWS RG CGWCGGR 
AVFRGVLGVADVDGVGAE 
PSSGVFLESRMWMVWGQR 

CGRRVPRGRQRQLEVQVV 
AVEVCQGGESGSYSS KFW 
PLRSASAARAAATARSSG 

CCC GTT GGA GCT GCG TGA CCG GCG GGA GCG ACG GCG ACA TCG AGC TGA ACT TGG 
54657 54666 54675 54684 54693 54702 

GGG CAA CCT CGA CGC ACT GGC CGC CCT CGC TGC CGC TGT AGC TCG ACT TGA ACC 

GQPRRTGRPRCRCSST*T 
GN LDALAALAAAVARLEP 
ATST, HWP PSLPL*LDLNH 

* TRHEN lEWWVT * CA RRS 

ELATSM *RGGSPRAPEE V 

LHPA*KDGVLRDLLSKS 
IP _ ^_ 

* TGA GTT CAC GCC ACG AGT AAA TAG AGG GTG GTC TGC CAG ATC GTC CGA GAA GCT 
54711 54720 54729 54738 54747 54756 

ACT CAA GTG CGG TGC TCA TTT ATC TCC CAC CAG ACG GTC TAG CAG GCT CTT CGA 

TQVRCSFI SHQTV*Q AL R 
LKCGAHLSPTRRSSRLFD 
SSAVLIYL P PDGLAGSS T 

RRL*PRH- GCCRMSARWSP 
GASDHG-TVAADCVQAGP H 
EQPTMAQSRLMAYKRAL I 

GAG GAC GCC TCA GTA CCG GAC ACT GGC GTC GTA GCG TAT GAA CGC GCG GTC CTA 
54765 54774 54783 54792 54801 5481,0 

CTC CTG CGG AGT CAT GGC CTG TGA CCG CAG CAT CGC ATA CTT GCG CGC CAG GAT 



LRSH GL*PQHR ILARQD 
r- S C G V M A. C D R S- I A Y -L R A R M 
PAESWPVTAA SHTC A P G W 

CRTRALFGSAAVNARP T P 
VGRGPWFGVPQWTPERHL 
SVEDPG SVWQSGRQSETY 

CCT GTG GAG CAG GCC CGG TCT TTG GGT GAC CGA CGG TGC AAC CGA GAG CCA CAT 
54819 54828 54837 54846 54855 54864 

GGA CAC CTC GTC CGG GCC AGA AAC CCA CTG GCT GCC ACG TTG GCT CTC GGT GTA 

GHLVRARNPLAATLALGV 
DTSSGPETHWLPRWL SV* 
TPRPGQKPTGCHVGSRCR 

WTSTIPRRWSPSPATWDP 
GPAPSRADGPPHLPRGTR 

-214- 



CCG GTC CAC GAG CAC TAG CCC GCA GAG GTC CTC CCA CTT CCC CGG CAG GTC AGG 
54873 54882 54891 54900 54909 54918 

GGC CAG GTG CTG GTG ATC GGG CGT CTC CAG GAG GGT GAA GGG GCC GTC CAG TCC 

GQVLVIGRLQEGEGAVQS 
ARCW*SGVSRRVKGPSSP 
PGAGDRASPGG* RGRPVR 

THPPAC . PYFSSP SGRSNP 
R TRLHAHTSVP. P RAGPTR 
AHASTRMPLFQLALGPLE 

CCG CAC ACG CCT CCA CGC GTA CCC ATC TTT GAC CTC CCG CTC GGG GCC CTC AAG 
54927 54936 54945 54954 54963 54972 

GGC GTG TGC GGA GGT GCG CAT GGG TAG AAA CTG GAG GGC GAG CCC CGG GAG TTC 

GVCGGAHG*KLEGEPREF 
ACAEVRMGRNWRASPGSS 
RVRRCAWVETG GRAPGVR 

mm[ ASAYTASSTA TSKRGGSN 
^^RVRTPPPAPRPP SEAGRT 
ACERLHRLQDRHVKPGGL 

CCG CGT GAG CGC ATC CAC CGC CTC GAC CAG CGC CAC CTG AAA GCC GGG GGG CTC 
54981 54990 54999 55008 55017 55026 

GGC GCA CTC GCG TAG GTG GCG GAG CTG GTC GCG GTG GAC TTT CGG CCC CCC GAG 

G ALA*VAELVAVDFRPPE 
AHSRRW RSWSRWTFGPPS 
RTRVGGGA GRGGLSAPRV 

STCCRSG .CSSA* *RRASA 
RH.VAGAGVRHLE DDAPVQ 
EIYLVPEWVI FSMMPP CK 

.^AAG CTA CAT GTC GTG GCC GAG GGT GTG CTA CTT CGA GTA GTA GCC GCC CGT GAA 
JP/ 55035 55044 55053 55062 55071 55080 

y TTC GAT GTA CAG CAC CGG XTC CCA CAC GAT - GAA -GCT CAT CAT CGG CGG GCA CTT 

FDVQHRLPHDEAHHRRAL 
SMYSTGSHTMKL I IGGHL 
RCTAPAPTR*SS SSAGTC 

TCSRRANSAVRRRPKWST 
PAPDGPTRHSGGDQSGAR 
RHLIEQREIRGETKAELE 

CGC CAC GTC CTA GAG GAC CGC AAG CTA CGC TGG GAG GCA GAA CCG AAG GTC GAG 
55089 55098 55107 55116 55125 55134 

GCG GTG CAG GAT CTC CTG GCG TTC GAT GCG ACC CTC CGT CTT GGC TTC CAG CTC 

AVQDLLAFDATLRLGFQL 
RCRISWRSMRP SVLASSS 
GAGSPGVRCDPP SWLPAR 
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RTTRRYASACSRAPTTAP 
GRRVATRARAPGRPRLRP 
DEDYPPVRERLVARAYDR 

GAG GAG GAG CAT GCC GCC ATG CGC GAG CGC GTC CTG GCG CGC CCG CAT CAG CGC 
55143 55152 55161 55170 -55179 55188 

GTC CTC GTC GTA CGG CGG TAC GCG CTC GCG CAG GAC CGC GCG GGC GTA GTC GCG 

VLVVRRYALAQDRAGVVA 
S SSYGGTRSRRTARA* SR 
PRRTAV RARAGPRGRSRG 

RSCAPCSPTTTGACPSPR 
DP APRAPRRQRVLVPLHG 
TQLLGP LVANDYWCLSIA 

CCA GAC CTC GTC CGG CCC GTC CTG CCG CAA CAG CAT GGT CGT GTC CCT CTA CCG 
55197 55206 55215 55224 55233 55242 

GGT CTG GAG CAG GCC GGG CAG GAC GGC GTT GTC GTA CCA GCA CAG GGA GAT GGC 

GLEQAGQDGVVVPAQGDG 
"^VWSRPGRTALSYQ .HREMA 
'^S G A G R A G R R C R T S T G R W P 

G S T C W T S S R S C R S S T S R R 
GARA GH VAGRVAPVP RD G 
EREHVMYQ.EAF LPFQDIE 

GAG GGC GAG CAC GTG GTA CAT GAC GAG GCG CTT GTC GCC CTT GAC CAG CTA GAG 
55251 55260 55269 55278 55287 55296 

CTC CCG CTC GTG CAC CAT GTA CTG CTC CGC GAA CAG CGG GAA CTG GTC GAT CTC 

LPLVHHVLLREQRELVDL 
SRSCTMYCS ANSGNWSIS 
P A R A P C T A P R T A G T G R S P 

CT .RSGPLWRARRTSSNTW 
AHERGRC GVHGE HRPTRG 
^P MNE VGAAL TGK TD L L E D 

GCC GTA CAA GAG CTG GGG CCG TCG GTT GCA CGG GAA GCA CAG CTC CTC AAG CAG 
55305 55314 55323 55332 55341 55350 

CGG CAT GTT CTC GAC CCC GGC AGC CAA CGT GCC CTT CGT GTC GAG GAG TTC GTC 

RHVL DPGSQRALRVEEFV 
GMFSTPAANVP. FVSRS S S 
ACSRPRQPTCPSCRGVRP 

RRPSN SCCPGG GRNSRRS 
AGPR TRAAPAAE GTRDVR 
LAQALEL LLPRRGQE I SA 



GTC GCG GAC CCG CTC AAG CTC GTC GTC 
55359 55368 55377 

CAG CGC CTG GGC GAG TTC GAG CAG CAG 



CCC GGC GGA GGG GAC AAG CTA GCT GCG 
55386 55395 55404 

GGG CCG CCT CCC CTG TTC GAT CGA CGC 
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SAWASS S SRG RLPC .S I DA 
APGRVRAAGAASPVRSTR 



PRRTPS S RKAWPVRRSAR 
HDGRRRP GSQGPFEAHLG 
ITEEDALVAKGLSSQTFG 

CTA CCA GAG GAG CAG CCG CTC CTG GCG AAA CGG GTC CCT TGA GAC GCA CTT CGG 
55413 55422 55431 55440 55449 55458 

GAT GGT CTC CTC GTC GGC GAG GAC CGC TTT GCC CAG GGA ACT CTG CGT GAA GCC 

DGLLVGEDRFAQGTLREA 
MVSSSARTALPRELCVKP 
WSPR RRGPLCPGNSA*SP 

RRAPPR CRSAWWGCPRCT 
GGQPRGADAQGGDAHDVP 
AAKRAAQMQKGVMRM T SL 

GCG GCG GAA CGC CCG CCG GAC GTA GAC GAA CGG GTG GTA GGC GTA CCA GCT GTC 
55467 55476 55485 55494 55503 55512 

"^^•tc CGC CTT GCG GGC GGC CTG CAT CTG CTT GCC CAC CAT CCG CAT GGT CGA CAG 

w 



RRLAGGLH LLAHHPHGRQ 
AALRAACI CLPT IRMV DR 
PPCGRPASACPPSAWSTG 

<z 

RRGRCSRPT*APRVGWVC 
EEEAAAEQLEHQGLEGC A 
NKKRPLKKSN S A * S G V R 



CAA GAA GAA GGC GCC GTC GAA GAA CCT CAA GTA CGA CCG GAT TGA GGG GTG' TGC 
55521 55530 55539 55548 55557 55566 

GTT CTT CTT CCG CGG CAG CTT CTT GGA GTT CAT GCT GGC CTA ACT CCC CAC ACG 

VL LPRQLLG VHAGLTPHT 
FFFRGSFL EFMLA*LPTR 
SSSAAASWSSCWPNSPHA 

GYPGPTS GYLIRTRTCAS 
' G M L V R H R G T CFG L V P A R V 

VWLSGTDVRVFDSYPHVC 

GTG GGT ATT CCT GGG CCA CAG CTG GGC ATG TTT TAG GCT CAT GCC CAC GTG CGT 
55575 55584 55593 55602 55611 55620 

CAC CCA TAA GGA CCC GGT GTC GAC CCG TAC AAA ATC CGA GTA CGG GTG CAC GCA 

HP*GPGVDPYKI .RVRVHA 
THKDPVSTRTKS EYGCTH 
PIRTRCRPVQNPSTGART 

IFAL*AA RCEDRSRRLRV 
SLLWDRQAVNTGHVVCVF 
QYFGIV SRSMRGTFSAFS 



GAC TAT TTT CGG TTA GTG CGA CGC GCT GTA AGC AGG GCA CTT GCT GCG TTT GCT 
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55629 -.. .- . • 5563a'i:\=^^- 55^47' ' . 55656;^>:; : • 55665'-' ' 55674 
CTG ATA AAA GCC AAT CAC GCT GCG CGA CAT TCG TCC CGT GAA CGA CGC AAA CGA 



LIKANHAARHSSRERRKR 
**KPITLRDIRPVNDANE 
DKSQSRCATFVP*TTQTN 

GGGARGTRRVCGGIW GRQ 
EGVLAVLEVCAVASGDGS 
SGWWRSWN*ARLRRDMGA 

TGA GGG GGT GGT CGC GCT GGT CAA GAT GCG TGC GTT GGC GGC TAG GTA GGG GCG 
55683 55692 55701 55710 55719 55728 

ACT CCC CCA CCA GCG CGA CCA GTT CTA CGC ACG CAA CCG CCG ATC CAT CCC CGC 

TPPPARPV LRTQPPIHPR 
L P H Q R D Q F Y A R N R R S I P A 
SPTSATSSTHATADPSPL 

GCSSRRTV*TSPGRRSPG 
GA VQGGP*ELVPAE GV PV 
ARLKVEQDSLYQPRESQS 

^iikcG GGC GTT GAA CTG GAG GAC CAG TGA GTT CAT GAC CCC GGA GAG GCT GAC CCT 
* 55737 55746 55755 55764 55773 55782 

TGC CCG CAA CTT GAC CTC CTG GTC ACT CAA GTA CTG GGG CCT CTC CGA CTG GGA 

CPQLDL LVTQVLGP LRL G 
ARNLTSW SLKYWGLSD. WD 
P A T * P P G H S S T G A S P T G T 

PRRRVGRRS RTP SWRGGG 
P G V V Y E E A H A L Q R G V G E E 
RASSTSRQTLSNAVLARR 

GGC CCG GCT GCT GCA TGA GGA GAC GCA CTC GCT CAA CCG CTG GTT GCG GGA GGA 
55791 55800 55809 55818 55827 55836 

CCG GGC CGA CGA CGT ACT CCT CTG CGT GAG CGA GTT GGC GAC CAA CGC CCT CCT 

^^^^P GRRRTPLRERVGDQRPP 

RADDVLL.CVSELATNALL 
^ G P T T Y S S A * A S W R P T P S S 

RRGARGHNGEERGSHRRR 
VADRGAMT EKKA DAIVAV 
WPT G G P WP K RRR T R * S P S 

GGT GCC GCA GGG CGG GCC GGT ACC AAA GGA AGA AGC GCA GGC GAT ACT GCC GCT 
55845 55854 55863 55872 55881 55890 

CCA CGG CGT CCC GCC CGG CCA TGG TTT CCT TCT TCG CGT CCG CTA TGA CGG CGA 

PR RPARPWFPSSRPL*RR 
HGVPPGHGFLLRVRYDGD 
TASRP.AMVSFFASAMTAT 

GGRRPGRCRFPRVGFGRR 
DEADLDVVASRAYGSGGV 
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GCA GGA GGC GCA GCT CCA GGT GCT GTC GCC TTG CCC GCA TGG GGC TTG GGG GCT 
55899 55908 55917 55926 55935 55944 

GGT CCT CCG CGT CGA GGT CCA CGA CAG CGG AAC GGG CGT ACC CCG AAC CCC CGA 

RPPRRGPRQRNGRTPNPR 
VLRVEVHDSGTGVPRTPD 
SSASRSTTAERAYPEPPT 

GRRLRGRDAGPRRAPRCT 
VGVFAAATQEQDARQGVL 
SGSSPPRPRSRTPASASL 

GCT GGG GCT GCT TCC GCC GGC GCC AGA CGA GGA CCA GCC GCG CGA CCG GCT GTT 
55953 55962 55971 55980 55989 55998 

CGA CCC CGA CGA AGG CGG CCG CGG TCT GCT CCT GGT CGG CGC GCT GGC CGA CAA 

R PRRRRPR SAPGRRAGRQ 
DPDEGGRG LLLVGALADK 
TPTKAAAV CSWSARWPTS 

^PRPRAFARCLRRPRTRRA 
'^^P AHAL SRGAFDDPGLE GH 
HPTPSRVGPLTTQASNAT 

CAC CCC GCA CCC GCT CGC TTG CGG GCC GTT TCA GCA GAC CCG GCT CAA GCG GCA 
56007 56016 56025 56034 56043 56052 

GTG GGG CGT GGG CGA GCG AAC GCC CGG CAA AGT CGT CTG GGC CGA GTT CGC CGT 

VGR GRANARQSRLGRVRR 
W GV G .E R T P G KVV W A E F A V 

GAWASERPAK SSGPSSPC 

PGKHLEQPPRLRE ASACS 
LARTCNRHLG*DKPQ RV P 
CPGQAI GTSAEIKRSVCL 

CGT CCC GGG AAC ACG TTA AGG ACA CCT CCG GAG TTA GAA AGC CGA CTG CGT GTC 
56061 56070 56079 56088 56097 56106 

ji^CA GGG CCC TTG TGC AAT TCC TGT GGA GGC CTC AAT CTT TCG GCT GAC GCA CAG 

AGPLCNSCGGLNLSADAQ 
QGPC AIPVEASIFRLTHR 
RAL V Q F L WRPQ S F G * R T G 

LC LSNVHGQGSRRTAGVL 
SACHTSMGRGVG GRRGWL 
LPVTLQCAGAWE AADGGC 

CTC TCC GTG TCA CTC AAC TGT ACG GGG ACG GGT GAG GCG GCG CAG CGG GGG TGT 
56115 56124 56133 56142 56151 56160 

GAG AGG CAC AGT GAG TTG ACA TGC CCC TGC CCA CTC CGC CGC GTC GCC CCC ACA 

ERHSELTCPCPLRRVAPT 
RGTVS* HAPAHSAASPPQ 
EAQ *VDMPLPTPPR-RPHK 
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AG GI S S SGESPLSADYG. 
RVVSQPPGRLHCHHTMGP 
ACWRNLLVG*IATIR*VR 



TCG CGT GGT GGC TAA CTC CTC CTG GGG AGT CTA CCG TCA CTA CGC AGT ATG GGC 
56169 56178 56187 56196 56205 56214 

AGC GCA CCA CCG ATT GAG GAG GAC CCC TCA GAT GGC AGT GAT GCG TCA TAC CCG 

SAPPIEEDPSDG S^^^ D A S Y P 
AH HRLRRTPQMA M R H T R 

RTTD*GGPLRWQ*CVIP< 



FVPRG*RSPWRPGRRSG1 
SSQGGEAHRGGRG EGRAE 
R L SAAR L TVA VAARAA L R 

CGC TTC TGA CCG GCG GGA GTC GCA CTG CCG GTG GCG CCG GGA GCG GCG CTC GGA 
56223 56232 56241 56250 56259 56268 

GCG AAG ACT GGC CGC CCT CAG CGT GAC GGC CAC CGC GGC CCT CGC CGC GAG CCT 

AKTGRPQRDGHRG PRREP 
It^^ RRLAAL SVTATAALAAS L 
IvjP-* EDWPPSA*RPPRPSPRAi 



RREGRW'PRGRPGYGTRPI 
DGSEGGRGGGLATDLVRA 
TEARGAVAAGSPRIWYAP 

GCA GAG GCG AGA GGG GCG GTG CCG GCG GGG GCT CCC GGC ATA GGT CAT GCG CCC 
56277 56286 56295 56304 56313 56322 

CGT CTC CGC TCT CCC CGC CAC GGC CGC CCC CGA GGG CCG TAT CCA GTA CGC GGG 

RLRSPRHGRPRGPYPVRG 
VSALPATAAPEGRIQYA G 
SPLSPPRPPPRAVSST Ri 

P L R R P R C SCRSG*PPGRC 
RCVGHGVAVDHVELRV VG 
ASATASL*MTFRLASWA 

GCG CCG TCT GCG GCA CCG GCT GTC GAT GTA GCA CTT GGA GTT CCG . CCT GGT GCG 
56331 56340 56349 56358 56367 56376 

CGC GGC AGA CGC CGT GGC CGA CAG CTA CAT CGT GAA CCT CAA GGC GGA CCA CGC 

RGRRRGRQLHREPQGGPR 
AADAVADSYIVN LKADHA 
RQTPWPTATS*T .SRRTTI 

n pnrprvrgrr strrrce 
trtg lgsagedllvagvd 
repes'aprartsfypasm 



GGC AAG CCC AAG GCT CCG GCC TGC GCG 
56385 56394 56403 

CCG TTC GGG TTC CGA GGC CGG ACG CGC 



GGA GCA GCT CTT CAT GCC GCG GCT GTA 
56412 56421 . 56430 

CCT CGT CGA GAA GTA CGG CGC CGA CAT 



-220- 



RSGSEAGRAL VEKYGADI 
VRVPRPDAPSSRSTAPTJ 

ACTCSPGSRSRSRPRRPi 
LARVLLGQVAVRDLGGLR 
SRVYLFARFP*AI SAE SA 

GCT CGC GTG CAT GTT CTT CCG GGA CTT GCC GAT GCG CTA GCT CCG GAG GCT CCG 
56439 56448 . 56457 56466 56475 56484 

CGA GCG CAC GTA CAA GAA GGC CCT GAA CGG CTA CGC GAT CGA GGC CTC CGA GGC 

RAHVQEGPER LRDRGLR G 
ERTYKKALNGYAIEASE A 
*SARTRRP*T ATRSRPPR1 

PWPARRRGPPRRRPGSGC 
L GLREGGVRRDGGHDLVA 
SALASAA SGATAETTWFR 

CCT CCG GTT CCG CGA GCG GCG GCT GGG CCG CCA GCG GAG GCA CCA GGT CTT GGC 
56493 56502 56511 56520 56529 56538 
^.^GGA GGC CAA GGC GCT CGC CGC CGA CCC GGC GGT CGC CTC CGT GGT CCA GAA CCG 
^1 _ 

''^GGQGARRRPGGRLRGPEP 
EAKA LAADPA VASVVQNR 
RPRRSPPTRRSPP WSRTi 

T*CRRSGSWGARRPGP GI 
HEADVRGLGVRGGPAQVA 
MNLMSAVWVLGGE QPR S R 

GTA CAA GTC GTA GCT GCG CTG GGT CTG GTT GGG CGG GAG GAC CCC GGA CCT GGC 
56547 56556 56565 56574 56583 56592 

CAT GTT CAG CAT CGA CGC GAC CCA GAC CAA CCC GCC CTC CTG GGG CCT GGA CCG 

HVQH RRDPDQPA LLGPGP 
MFSIDATQTNPPSWGLDR 
C SA S TR PRPTRP P GAW T I 

^ PGSSGGGSCST CRGPSPI 
^ H V L L V E G Q V A R V G V R " V R G 
TSWFFRGRFLEYV*GSEA 

GCA CCT GGT CTT CTT GGA GGG GGA CTT GTC GAG CAT GTG GAT GGG CCT GAG CCG 
56601 56610 56619 56628 56637 56646 

CGT GGA CCA GAA GAA CCT CCC CCT GAA CAG CTC GTA CAC CTA CCC GGA CTC GGC 

RGPEE PPPEQLVHLPGLG 
VDQKNLPLNSSY TYPDSA 
WTRRTSP*TARTPTRTRI 

APLSPTR*RCRRGC*GCIS 
PLSHRRVDDVGADADGVA 
PCPTVAYTMSVPTRMVWL 



GCC CGT CCC TCA CTG CCG CAT GCA GTA GCT GTG GCC GCA GGC GTA GTG GGT GTC 
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CGG GCA GGG AGT GAC GGC GTA GOT CAT CGA CAC CGG CGT CCG CAT GAG CCA GAG 



J 

^i^fleCG GGT CCT GGC GGT GGC GGT GGG GTG CGT GCA CCG GGG GTG CCA GGG GGC GTT 



RAGSDGVRHRHRRPHHPQ 
GQGVTAYVIDTGVRI THS 
GRE*RRT SSTPASASPTA 

SRRGPRRRSRRWRGR CGR 
VEAAPGGVAVVGDVVVVG 
SKPPRAE*P*SAMSLSLV 

GGT GAA GGG GGG GGG GGG GAG GAT GGG GAT GGT GGG GTA GGT GTT GGT GTT GTG 
56709 56718 56727 56736 56745 56754 

CGA GTT GGG CGG CGG GGG GTG GTA CGG GTA CGA CGG CAT CGA GAA CGA GAA GAG 

RLRRPGLLRLRRHRQRQH 
DFGGRASYGYDAIDNDNT 
TSAAGPPTATTPSTTTTP 

GPRG RGRCAR PRGPRR GR 
GL VAVAVARVHGARD G AV 
AWSPWPWPVGTAPVTAPL 

56763 56772 56781 56790 56799. 56808 

GGC CGA GGA CGG CCA CGG GCA GGG GAG GCA CGT GGG GGG GAG GGT GGG GGG GAA 

R PGRPRPRH ARGRHGRRQ 
AQDGHGHGTHVAGTVAGN 
PRTATAT ARTWPARSPAT 

RRRRWSPWSRLRGR ASCS 
GVADGL LGLDYADAHQV V 
A*PTALFALITPTRTSFL 

GGG GAT GGC GGA GGG GTT GTT CCG GTT GTA GGA TGC GGA GGG GGA GGA GTT GTT 
56817 56826 56835 56844 56853 56862 

CGG GTA CGG CGT GGG GAA GAA GGC GAA GAT CGT AGG GGT GGG GGT GGT GAA GAA 

^^jk^R LRRRQEGQDRRRPRAEQ 
AYGVAKKAKIVGVRVLNN 
P T A S P R R. P R S * A S A G * T T 

RGPGWRGPRRRCRSPRGS 
GALA GGGLDDGA DVP D GP 
EPWPVVAWTTAPMSQTAR 

GAG GCC GGT GGG GTG GTG GGG GGT CGA GGA GGG GGC GTA GGT GAC CGA GGG GGC 
56871 56880 56889 56898 56907 56916 

GTG GGG CGA GGG GAG CAC GGG CGA GGT GGT CGG GGG GAT GGA GTG GGT GGC CCG 

LRPGHHRPGRRRHRLGRP 
SGQG .TTAQVV AGI DWVAR 
PARAP PPRSSPA STGSPG 

RR*APRRWCTGRRRRRCP 
VGDL RGDGVHGEAAAGVR 
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CTT GCG GCA GTT CGG CCG GCA GCG GTT GTA CAG GGA GCC GCC GCC GCG GCT GTG 
56925 56934 56943 56952 56961 56970 

GAA CGC CGT CAA GCC GGC CGT CGC CAA CAT GTC CCT CGG CGG CGG CGC CGA CAC 

ERRQAGRRQHVPRRRRRH 
NAVKPAVANMSLGGGADT 
TPSSRPSPTCPSAAAPTR 

GRCPRVCRWPRRR*RRRp 
GEVRGYAVGHGGADGEGH 
ARSVATRLAMAEPTVKAT 

CCG GGA GCT GTG CCG GCA TGC GTT GCG GTA CCG GAG GCC GCA GTG GAA GCG GCA 
56979 56988 56997 57006 57015 57024 

GGC CCT CGA CAC GGC CGT ACG CAA CGC CAT GGC CTC CGG CGT CAC CTT CGC CGT 

GPRHGR TQRHGLRRHLRR 
ALDTAVRNAMASGV TFAV 
P STRPYATPWPPASP S PW 



PRCRTSWRRWSTVRVR* R 
RGAVLRGVGGRP*GCADG 
AAPLSDVLAEVLDGAR TV 



CCG CCG GCC GTT GCT CAG CTG GTT GCG GAG GTG CTC CAG TGG GCG TGC GCA GTG 
57033 57042 57051 57060 57069 57078 

GGC GGC CGG CAA CGA GTC GAC CAA CGC CTC CAC GAG GTC ACC CGC ACG CGT CAC 

GGR QRVDQRLHEVTRTRH 
AAGNESTNASTR SPAR VT 
RPATSRPTPPRGHPHASP 

PW*PRRSSWSPRWPRSSW 
L G D R D A R R G A R V G L G A V G 

SAMVT PAVVLESALAP*E 

I, > GCT CCG GTA GTG CCA GCC GCG CTG CTG GTC GAG CCT GCG GTT CCG GCC GAT GAG 
57087 57096 57105 57114 57123 57132 

^PRgA GGC CAT CAC GGT CGG CGC GAC GAC CAG CTC GGA CGC CAA GGC CGG CTA CTC 

RGHHGRRDDQLG RQGRLL 
EAITVGATTSSDAKAGYS 
RPSRSARRPARTPRPATP 

SRSRGRGRRGR NTW*RPR 
VVAGDEVEEGGTRGDGRG 
L*PETRSRKAGPEDMVEA 

GTT GAT GCC GAG GCA GGA GCT GGA GAA GCG GGG GCC AAG CAG GTA GTG GAG CCG 
57141 57150 57159 57168 57177 57186 

CAA CTA CGG CTC CGT CCT CGA CCT CTT CGC CCC CGG TTC GTC CAT CAC CTC GGC 

QLRLRPRPLRPRFVHHL G 
NYGSVLDLFAPGSSITSA 
TTAPSSTSSPPVRPSPRP 
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SSLRSPSWCWRRYTSPSG 
PV*AVRRGVGDGTRRHRG 
QFELSEAVLVMEPVDIAV 

GAG CTT GAG TTC GOT GAG CCG CTG GTT GTG GTA GAG GCC ATG GAG CTA CCG CTG 
57195 57204 57213 57222 57231 57240 

CTG GAA CTC AAG CGA CTG GGC GAG CAA CAC CAT CTG CGG TAG GTG GAT GGC GAG 

LELKRLGDQHHLRYVDGD 
WNSSDSA TNTISGTSMAT 
GTQATRRPTPSPVRRWRP 

ARrPPRRRAGGRRWGRPWG 
RVHRAGGREVEGGVGRGG 
GCTAPAAASWRAALGEAV 

GGG CGT GCA CCG CCC GCG GCG GCG CGA GGT GGA GCG GCG GTT GGG GAG CCG GTG 
57249 57258 57267 57276 57285 57294 

CCC GCA CGT GGC GGG CGC GGC GGC GCT CCA CCT GGC GGC CAA CCC CTC QGC CAC 

PA. RGGRRRAPPRRQPLGH 
PHVAGAAALHLAANP SAT 
R TWRAPPRSTSPPTPRPP 



TGPRWPASTR RWWRRR*W 
RGLDGRRQRGGGGGADD. G 
GDWTAVASV D AAVVPTTV 

GGG GAG GGT CCA GCG GTG CCG CGA CTG CAG GCG GCG GTG GTG GCC GCA GCA GTG 
57303 57312 57321 57330 57339 57348 

CCC GTC CCA GGT CGC CAC GGC GCT GAG GTG CGC CGC CAC CAC CGG CGT CGT CAC 

PVPGRHGADVRRHHRRRH 
PSQVATALT SAATTGVVT 
RPRSPR R*RPPPPPASSP 

GRCPSAWGAGTRRGAARG 
VGARARGVPEQVDAPPVV 
^IPP GPVPEGLRSRYTPRRCS 

GTT . GGG GCC GTG CCC GAG CGG GTT GGC CGA GGA CAT GCA GCC GGC CGC CGT GCT 
57357 57366 57375 57384 57393 57402 

CAA CCC CGG CAC GGG CTC GCC CAA CCG GCT CCT GTA CGT CGG CCG GCG GCA CGA 

QPRHGLAQP APVRRPAAR 
NPGTGSPNRLLYVGRRHD 
TPARARPTGSCT SAGGTT 

GEP GASRSCRH i5CS*RCS 
VR RARAELVGTVVRDAVV 
WGGPGRKSFVPS*VI L SL 

GGT GGG AGG CCC GGG CGC GAA GCT CTT GTG GCC ACT GAT GTG CTA GTC GCT GTT 
57411 57420 57429- 57438 57447 57456 

CCA CCC TCC GGG CCC GCG CTT CGA GAA CAC CGG TGA CTA CAC GAT CAG CGA CAA 
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pr ^S"-.- * P^ A'^^- rr " : ir^^ -E- -'' W'^ I^ -::-* - I,- V H D Q ' R Q 

HPPGPRFENTGDYT I SDN 
TLRARASRTPVTTRSAT^ 

WPRTGPSPRRRRRCRA R] 
GRD LGRHRDGADGAVRGR 
EVTSDGTVTEPTEPLAGE 

GAG GTG CCA GCT GAG GGG CCA CTG CCA GAG GCC GCA GAG GCC GTT GCG CGG GAG 
57465 57474 57483 57492 57501 57510 

CTC CAC GGT CGA GTC CCC GGT GAC GGT CTC CGG CGT CTC CGG CAA CGC GCC CTC 

LHGRVPGDG LRRLRQRAL 
STVESPVTVSGVSGNAPS 
PRSSPR*RSPAS PATR.P] 

GRRLPGCRGCTCRRGGPC 
GEGYLDVDDVRVDAVELD 
A'RAT STWMTWVYM P SRWT 

CCG GGA GCG GCA TCT CCA GGT GTA GCA GGT GTG CAT GTA GCC GCT GGA GGT CCA 
57519 57528 57537 57546 57555 57564 

jafiGC CCT CGC CGT AGA GGT CCA CAT CGT CCA CAC GTA CAT CGG CGA CCT CCA GGT 



^G PRRRGPH RPHVHRRPP G 
ALAVE VHIVHTYIGDLQV 
P SP * RS T S ST RT S A T S R i 

ASRGRRCPTCA*TTRCRI 
LQDGGVARRVRELRVAGA 
WSIAGS.PVAYVSLDYPVP 

GGT CGA CTA GCG GGG GCT GCC GTG CCG CAT GTG CGA GTT CAG CAT GCC GTG GCC 
57573 57582 57591 57600 57609 57618 

CCA GCT GAT CGC CCC CGA CGG CAC GGC GTA CAC GCT CAA GTC GTA CGG CAC CGG 

PADRPRRHGVHAQVVRHR 
QLIAPDGTAYTLKSY G TG 
S*SPPTARRTRSSRTAPi 



m 



/CNPCC*CWT SPSRRRPPI 
A T R V V D.V G R V R H V G G R L R 
P L E S L M L V V Y E T F A E E S A 

GCC GTC AAG CCT GTT GTA GTT GTG GTG CAT GAG CCA CTT GCG GAG GAG CCT CCG 
57627 57636 57645 57654 57663 57672 

CGG CAG TTC GGA CAA CAT CAA CAC CAC GTA CTC GGT GAA CGC CTC CTC GGA GGC 

RQFGQHQHHVLGERLLGG 
G S SD N I N T TYSV NA S S E A 
AVR TTSTPRTR*TPPRRi; 

WRCTSVAPSRCRSSRCR is 
GVARPFQPHAVVRVVVGP^ 
ALPVHFSRTLSLAF*SVP 



CCG GTT GCC GTG CAC CTT TGA CGC CCA CTC GCT GTT GCG CTT GAT GCT GTG GCC 
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GGC CAA CGG CAC GTG GAA ACT GCG GGT GAG CGA CAA CGC GAA CTA CGA CAC CGG 



GQRHVETAGERQRELRHR 
ANGTWKLRVSDNANYDTG 
PTARGNCG*ATTRTTTP G 

CLRRPAATRARGSWD*DD 
AYVGPRQLELGGQGTRTT 
RMSAQASCN*GERVLGLR 

CGC GTA TCT GCG GAC CCG CGA CGT CAA GAT CGG GAG GGA CTG GTC AGG ATC AGC 
57735 57744 57753 57762 57771 57780 

GCG CAT AGA CGC CTG GGC GCT GCA GTT CTA GCC CTC CCT GAC CAG TCC TAG TCG 

AHRRLGAAVLALPDQS * S 
RIDAWALQF*PSLTS P S R 
A*TPGRCSSSPP*PVLVV 

ERCPVPDRGPWGRPRG.VD 
RAARCRTGVRGVALVVWT 
GRPVAGPGSGALRSSSGR 

'"~ AGC'^GCC GTG CCG TGG CCC AGG GCT GGG CCG GTT GGC GCT CCT GCT GGG TGC 
57789 57798 57807 57816 57825 57834 

TCC TCG CGG CAC GGC ACC GGG TCC CGA CCC GGC CAA CCG CGA GGA CGA CCC ACG 

SSRHGT G SRP GQ PRGRPT 
PRGTAPG.PDPANREDDPR 
LAARH RVPTRPTARTTHV 

PGPVGGGALSDLG APRPP 
R GR C AA E P L P T S A R Q A P H 
GAGARRRRCPLRPGSPPT 

AGG CCG GGG CCG TGC GGC GGA GGC CGT TCC CTC AGC TCC GGG CGA CCC GCC CCA 
57843 57852 57861 57870 57879 57888 

TCC GGC CCC GGC ACG CCG CCT CCG GCA AGG GAG TCG AGG CCC GCT GGG CGG GGT 

^^^^ GPGTPPPARESRPAGRG 
^^^P A P A R R L .R Q G S R G P L G G V 

R P R H A A S G K G V E A R W A G W 

YPTGGGLGKSCPTDGAVC 
TRPAEGWARRA PPT G L * A 
PVPHRGGLGELLPHGWSR 

CCC ATG CCC CAC GGA GGG GGG TTC GGG AAG CTC GTC CCC CAC AGG GGT CGA TGC 
57897 57906 57915 . 57924. 57933 57942 

GGG TAC GGG GTG CCT CCC CCC AAG CCC TTC GAG CAG GGG GTG TCC CCA GCT ACG 

GYGVPPPKPFEQGVS PAT 
GTGCLP PSPSSRGCPQLR 
VRGASPQAL RAGGVPSYA 

AAGI PRTGGRARLRTRRS 
HQASPARVG VPGCDRVAP 
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GTA CGA CGC GGC TAG CCC GCG CAT GGG GGT GCC CGG GOG TCA GCG CAT GCC GCC 
57951 57960 57969 57978 57987 57996 

CAT GCT GCG CCG ATG GGG CGC GTA CCC CCA CGG GCC CGC AGT CGC GTA CGG CGG 



HAAPM GRVPPRARSRVRR 
MLRRWGAYPH GPAVAYGG 
CCADGARTPTGPQSRTAG 

PSTDPPTRGCHGADVRPV 
LPRTPPHGGATVPTLVRC 
FPVHRPTDARLSRR*CA A 

CTT CCC CTG CAC AGC CCC CCA CAG GCG GGC GTC ACT GGC CGC AGT TGT GCG CCG 
58005 58014 58023 58032 58041 58050 

GAA GGG GAC GTG TCG GGG GGT GTC CGC CCG CAG TGA CCG GCG TCA ACA CGC GGC 

EGDVSGGVRPQ*PASTRG 
KGTCRGVSARS DRR. QH .AA 
RGRVGGCPPAVT GVNTRH 



Z^dttK EQGLPAAPGLVSVGRRPG 



RRAWPHRRDS SPCGGARG 
GGPGLT GGTRPRVGGPA A 



TGG AGG ACC GGG TTC CCA CGG CGG CCA GGC TCC TGC CTG TGG GGG GCC GCG CCG 
58059 58068 58077 58086 58095 58104 

ACC TCC TGG CCC AAG GGT GCC GCC GGT CCG AGG ACG GAC ACC CCC CGG CGC GGC 

TSWPKGAAGPRTDTPRRG 
PPGPRVPPVRGRTPPGAA 
LLAQGCRRS EDGH PPARP 

SGCRLGLSRAGGGVGWLG 
RGVVCG LAVRVGVWGGCA 
GVW LAVWP*ACGWGGGVP 

? ; GGG CTG GGT GTT GCG TTG GGT TCC GAT GCG CGT GGG GGT GGG TGG GGG GTG TCC 
'i^t ^^^^^ 58122 58131 58140 58149 58158 

W^!^ GAC CCA CAA CGC AAC CCA AGG CTA CGC GCA CCC CCA CCC ACC CCC CAC AGG 



PDPQRNPRLRAPPPTPHR 
PTHNATQGYAHP.HPPPTG 
RPTTQPKATRT PTHPPQA 

GC AHARAGGGGRS *WRRP 
AAPMRVRVGVVAPDGGEP 
RRLCACACGWWR P I VVKP 

GGC GGC GTC CGT ACG CGT GCG CGT GGG GGT GGT GGC GCC CTA GTG GTG GAA GCC 
58167 58176 58185 58194 58203 58212 

CCG CCG CAG GCA TGC GCA CGC GCA CCC CCA CCA CCG CGG GAT CAC CAC CTT CGG 

ppqacarap. ppprdhhlr 
rrrhahahphhrgi ttfg 
aagmrt rtptt'agsppsg 
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GWKTGGRGGSVMRGTTRW 
DGNR GAEGGA*WEGLRVG 
TGMEDRRAGRKGNAWDYA 

CCA GGG GTA AAG CAG GGC GGA GCG GGG GGC GAA TGG TAA GCG GGT CAG CAT GCG 
58221 58230 58239 58248 58257 58266 

GGT CCC CAT TTC GTC CCG CCT CGC CCC CCG CTT ACC ATT CGC CCA GTC GTA CGC 

GPHFVPPRPPLTIRPVVR 
VPISSRLAPRLPFA QSYA 
SPFRPASPPAYHSPSRTP 

NG GGPGAARVLLVTGTDM 
TGAARGQRGFWSCPV RTW 
LERRGARGGSGPARYGHG 

GTC AAG GGC GGC GGG CCG GGA CGG CGG GCT TGG TCC TCG TGC CAT GGG CAC AGG 
58275 58284 58293 58302 58311 58320 

CAG TTC CCG CCG CCC GGC CCT GCC GCC CGA ACC AGG AGC ACG GTA CCC GTG TCC 

QFPPPGPAARTRSTVPVS 
^if'^ SRRPALPPEPGAR YPCP 
VPAARPCRPNQEHGTRVH 

G G G G P G W C G C P D G S C G W P 
VEAG RVGVAALTGPAAGL 
YRRGGSGLLRLPGRLLG>L 

TAT GGA GGC GGG GGG CCT GGG GTT GTC GGC GTT CCC AGG GGC CTC GTC GGG GTT 
58329 58338 58347 58356 58365 58374 

ATA CCT CCG CCC CCC GGA CCC CAA CAG CCG CAA GGG TCC CCG GAG CAG CCC CAA 

IPPPPGPQQPQGSPEQP Q 
YLRPPDPNSRKGPRSSP K 
TSAPRTPTAARVPGAA PR 

CFACPWYGGGDGYGCPAG 
ASRAPGTGA VTAMGARRV 

^PLVRLALVRWRRWVRVAC 
.^Jl^ 
j^,, - 

. CCC GTC TTG CGC GTC CCG GTC ATG GGC GGT GGC AGC GGT ATG GGC GTG CCG CGT 

58383 58392 58401 58410 58419 58428 

GGG CAG AAC GCG CAG GGC CAG TAC CCG CCA CCG TCG CCA TAC CCG CAC GGC GCA 

GQNAQGQYPPPSPYPHGA 
GRTRRASTRHRRHTR. TAH 
AERAGPVPATVAIPARRT 

PAGPGYAYWWG * PEWLG* 
RPGPVTRTGGGRRSGCGR 
GPGR S RVRVVVGVAGVAG 

GGG CCC CGG GGC CCT GGC ATG CGC ATG GTG GTG GGG ATG CCG AGG GTG TCG GGG 
58437 58446 58455 '58464 58473 58482 

CCC GGG GCC CCG GGA CCG TAC GCG TAC CAC CAC CCC TAC GGC TCC CAC AGC CCC 
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PGPRDRTRTTTPTAPTAP 
RGPGTVRVPPPLRLPQPL 

PRGAGTLPTAMPARTRPM 
RGGRVR*RRRWRRGPGRC 
VAAGCG DVADGDAGQDEA 

ATG CCG GCG GGG CGT GGG GAG TTG CCG GAG CGG TAG COG CGG GAG GAG GAG CCG 
58491 58500 58509 58518 58527 58536 

TAG GGC CGC CCC GCA CCG GTC AAC GGG GTC GCC ATG GGG GCC CTG GTC CTC GGG 

YGRPAPVNGVAI GALVLG 
TAAPHPSTASPSAPWSSA 
RPPRTRQRRRHRRPGPRH 

RQKRGATPSTSPSIASAC 
GRSEAPR LAPAPVSRAPA 
DEAKQRGYPQHQSQDRQR 

TAG GAG ACG AAA GAG GGC CGG CAT CCC GAG GAG GAG CGT GAC TAG CGC GAC CGC 
58545 58554 58563 58572 58581 58590 

/:^TC CTC TGC TTT CTG CCG GCC GTA GGG CTG GTG CTG GGA CTG ATG GCG CTG GCG 

j^i .„ „ 

ILCFLPAVGLVLGLI ALA 
S SAP CR P * GWCWD * S R W R 

PLLSAGRRAGAGTDRAGA 

ILFRPSRPLPMAI APE TS 
S *SA PRALCPCPSLRNPA 
LDLLPA LSALAHRYGTRH 

GTC TAG TTC TTG GCC CCG CTC GCT CCG TTG CCG TAG CGC TAT CGG CCA AGG GAG 
58599 58608 58617 58626 58635 58644 

CAG ATG AAG AAG CGG GGC GAG CGA GGC AAG GGC ATG GCG ATA GCC GGT TCG GTG 



QIKKRGERGKGMAIAGSV 
RSRSGASEARAWR*PVRC 
DQEAGRARQGH GDSRFGA 




EG ADSEDQPRHRQGRAEG 



GAG AGG ACG CAG GCT GAG CAG GAC ACG TGC GAG AGG GAC AGG TGC CCG AAG TGG 
58653 58662 58671 58680 58689 58698 

CTC TGC TGC GTC GGA CTC GTC CTG TGG ACG GTG TCG CTG TCG ACG GGC TTC ACG 



LSCVGLVLWTVSLSTGFT 
SPASDSSCGRCR CPRASP 
LLRRTRPVDGVAVHGLHL 

STTSPKLSAALPSPVG*A 
RRRRRS *PRRSRR *PCGRR 
GVDDVAELVGRAALAGGV 



AGG CTG CAG CAG CTG CCG AAG TTC CTG CGG CGC TCG CCG CTC CCG TGG GGG ATG 
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TCC GAC GTC GTC GAG GGC TTC AAG GAG GCC GCG AGC GGC GAG GGC ACC CCC TAG 



SDVVDGFKDAASGEGTPY 
PTS STASRTPRAARAPPT 
RRRRRLQGRRERRGHPL] 

RALPSQKSEAVSVRSPAi 
GRWPRS SRSPSRCGPPRP 
GEGLAVAEVRRGVGQLAR 

CGG GAG CGG TTC CCG CTG ACG AAG CTG AGC GGC TGG CTG TGG GAC CTC CCG CGC 
58761 58770 58779 58788 58797 58806 

GCC CTC GCC AAG GGC GAC TGC TTC GAC TCG GCG ACC GAC ACC CTG GAG GGC GCG 

ALAKGDCF DSATDTLEGA 
PSPRATASTRRPTPWRAR 
PRQGRLLRLGDRHPGGRC 

* ST S S T GQEAAC S P S TN 2 
RRRPRPARSRRARRRP TR 
GVVHVLHGAGGRVVALHE 



J^GG ATG CTG CAC CTG CTC CAC GGG ACG AGG CGG CGC GTG CTG CCG CTC CAC AAG 

58815 58824 58833 58842 58851 58860 

GCC TAG GAC GTG GAC GAG GTG CCC TGC TCC GCC GCG CAC GAC GGC GAG GTG TTC 

AYDVDEVPCSAA HDGE VF 
PT TWTRCPAPPRTTARC S 
L RR G R G A L L RR A R R.R G V I 

T TVRGP PAKGP S S S S VRA 
PR* GGRRRRGPRRRV * GS 
RDDGEGAAGERAVVFEGP 

CGC GAG CAG TGG GAG GGG CCG CCG CGG AAG GGC CCG CTG CTG CTT GAG TGG GCC 
58869 58878 58887 58896 58905 58914 

GCG GTC GTC ACC CTC CCC GGC GGC GCC TTC CCG GGC GAC GAC GAA CTC ACC CGG 

A VVTLPGGAFPGDDELTR 
RSSPSPAAPSRATTNSPG 
G R H P P .R R- R L P G R R R T H P I 

ASSLH*ASE AAVGHVGPC 
RRPCTNRARRR* AMSVQA 
GGLVLTVREGGSRWPCRP 

TGG CGG CTC CTG TTC ACA ATG CGC GAG AGG CGG CGA TGC GGT ACC TGT GGA CCC 
58923 58932 58941 58950 58959 58968 

ACC GCC GAG GAC AAG TGT TAG GCG CTC TCC GCC GGT ACG CCA TGG ACA CCT GGG 

TAEDKCYALSAATPWT PG 
PPRTSVTRSPPLRH.GHLG 
RRGQVLRAL RRYAMDTWi^ 

Y .RV VRV D VV E D R G A L A P P 
TGSSAST**KMGVRWLQR 
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GGC ATG GCC TGC TGC GCC TGC AGA TGA TGA AGT AGG GCT GGG CGG TCT CGA CCG 
58977 58986 58995 59004 59013 59022 

CCG TAC CGG ACG ACG CGG ACG TCT ACT ACT TCA TCC CGA CCC GCC AGA GCT GGC 



PYRTTRTSTTSSRPARAG 
RTGRRGRLLLHPDPPELA 
VPDDADVYYFIPTRQSWR 

EAV ALDGAQEAGRLVVAL 
KPSRSIVQRNPAVCSSPL 
SRRGRS *RGTRR WAPRRC 

CGA AGC CGC TGG CGC TCT AGT GGA CGG ACA AGC CGC GGT GCG TCC TGC TGC CGT 
59031 59040 59049 59058 59067 59076 

GCT TCG GCG ACC GCG AGA TCA CCT GCC TGT TCG GCG CCA CGC AGG ACG ACG GCA 

ASATARSPACSAPRR .TTA 
LRRPRDHLPVRRHAG RRQ 
FGDREI TCLFGATQDDGK 

QGA*QAAVRRCEVG 'VLDG 
M^"" SVPESRLSGVVS S A S W T A 
ASRSVACRGSSVRR RGPR 

TCG ACT GGC CGA GTG ACG CGT CGC TGG GCT GCT GTG AGC TGC GGC TGG TCC AGC 
59085 59094 59103 59112 59121 59130 

AGC TGA CCG GCT CAC TGC GCA GCG ACC CGA CGA CAC TCG ACG CCG ACC AGG TCG 

S*PAHCAATRR.HSTPTRS 
ADRLTAQRP DD TRRRPGR 
LTGSLRSDP TTLDADQVA 

EEG RG. VGDVGRQVLLRLF 
KREAVLA TSVASYSSGS S 
RGRRSWRRRCRATRPAPP 

: GGA AGG AGA GGC GCT GGT TGC GGC AGC TGT GGC GCG ACA TGC TCC TCG GCC TCC 
59139 59148 59157 59166 59175 59184 

,2^CT TCC TCT CCG CGA CCA ACG CCG TCG ACA CCG CGC TGT ACG AGG AGC CGG AGG 



PSSPRPTPS TPRCTRSRR 
LPLRDQRRRHRAVRGAGG 
FLSATN AVDTALYEEPEE 

VRLVVQGRVLGPRLVDVG 
YASSSRAAFLAQAFSTWA 
IRPP RGPRS CPRPSPRGR 

TTA TGC GCC TCC TGC TGG ACC GGC GCT TGT TCC GGA CCC GCT TCC TGC AGG TGC 
59193 59202 59211 59220 59229 59238 

AAT ACG CGG AGG ACG ACC TGG CCG CGA ACA AGG CCT GGG CGA AGG ACG TCC ACG 

NTRRTTWPRTRP GR RTST 
I RGGRPGREQGLGEGRPR 
YAEDDLAANKAWAKDVHA 
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HEALLDLAARVCSASPRI 
TSPSCI SPQASVAPRLAG 
RARRASRPSRPCLQGFPA 

GGC ACG AGC CGC TCG TCT AGO TCC CGA CGC GCC TGT GTC GAG CGG CTT CCC GCG 
59247 59256 59265 59274 59283 59292 

COG TGC TCG GCG AGC AGA TCG AGG GCT GCG CGG ACA CAG CTG GCC GAA GGG CGC 

PCSA SRSRAARTQLAEGR 
RARRADR,GLRGHSWPKGA 
VLGEQI EGCADTAGRRAI 

RAPRRDPRPSPPRGSPS] 
GLRDGIQDLLHLVGPLVP 
ASGT ASRTSSISSARFSQ 

GCG GCT CGG CCA GCG GCT AGA CCA GCT CCT CTA CCT CCT GCG GGC CTT CCT GAC 
59301 59310 59319 59328 59337 59346 

CGC CGA GCC GGT CGC CGA TCT GGT CGA GGA GAT GGA GGA CGC CCG GAA GGA CTG 

RR.AGRRSGRGDGGRPEGL 
AEPVADLVEEMEDARKDW 
PS RSPIWSRRWRTPGRTC 

SPPPPWSRP CTSC TSRCI 
RLRRRGRVRVRVV RVVVA 
AFAAAAVF ASVY*VY* SL 

CCG CTT CCG CCG CCG CCG GTG CTT GCG CCT GTG CAT GAT GTG CAT GAT GCT GTC 
59355 59364 59373 59382 59391 59400 

GGC GAA GGC GGC GGC GGC CAC GAA CGC GGA CAC GTA CTA CAC GTA CTA CGA CAG 

GEGGGGHERGHVL HVLR ^ Q 
AKA .AAATNADTYYTYYD S 
RRRRRPRTRTRTTR TT T I 

IRTR RRGRSR*RACPEPC 
SVLVDVA GRGDGRALSQA 
iM<P Y SYTSPGAVTVARLARP 

ff^--- 

^ GCC TAT GCT CAT GCA GCT GCC GGG GCG CTG GCA GTG GCG CGC GTT CCG AGA CCC 
59409 59418 59427 59436 59445 59454 

CGG ATA CGA GTA CGT CGA CGG CCC CGC GAC CGT CAC CGC GCG CAA GGC TCT GGG 

RI RVRRRPRD RHR AQG S G 
GYEYVDGPATVTARKAL G 
DTSTSTAPRPSPRARL W/ 

PCWRATTR PPG RCRRCRS 
QVGGHRRVLLVGAGAVAP 
RSVVTGDYSSSGPV PSLP 

GGA CCT GTG GTG GCA CGG CAG CAT GCT CCT CCT GGG GCC GTG GCC GCT GTC GCC 
59463 59472 59481 59490 59499 59508 

CCT GGA CAC CAC CGT GCC GTC GTA CGA GGA GGA CCC CGG CAC CGG CGA CAG CGG 
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P- a— H--- H^^^ V^^^- V'^ *R: -G'^' G^" P" R^^ R Q R 

LDTTVPSYEEDPGTGDSG 
WTPPCRRTRRTPAPATAG 

RPRCRRRG*HTLPPTLAA 
ALAAAAAAEIHSRLHSRP 
LSPPLPPPRLTHASTHAR 

CTC GCT CCC GCC GTC GCC GCC GCC GGA GTT ACA CAC TCG CCT CCA CAC TCG CGC 
59517 59526 59535 59544 59553 59562 

GAG CGA GGG CGG CAG CGG CGG CGG CCT CAA TGT GTG AGC GGA GGT. GTG AGC GCG 

ERGRQRRRPQCVSGGVSA 
SEGGSGGGLNV*AEV*AR 
ARAAAAAAS MCERRCERG 

lAPLFHRRLARRVCLDDC 
* L P S F T GAYL GG C AC T MV 
SYRPSLAQTFG EARVL * * 

CGA TAT CGC CCC TCT TTC ACG GAC GCA TTT CGG GAG GCG TGC GTG TTC AGT AGT 
59571 59580 59589 59598 59607 59616 

^^CT ATA GCG GGG AGA AAG TGC CTG CGT AAA GCC CTC CGC ACG CAC AAG TCA TCA 

^ _ 

AIAGRKCLRKALR THKSS 
L*RGESA CVKPSART SHH 
YSGEKVPA*SPPHAQVIT 

R T I R Q G K S A R S L G P N G .P Q 
DLSERAKAQVPCGLTALS 
MSHNEPRQKCPVVWPQWA 

GTA GCT CAC TAA GAG ACC GGA AAC GAA CGT GCC CTG TTG GGT CCC AAC GGT CCG 
59625 59634 59643 59652 59661 59670. 

CAT CGA GTG ATT CTC TGG CCT TTG CTT GCA CGG GAC AAC CCA GGG TTG CCA GGC 

H RVILWPLLARDNPGLPG 
IE*FSGLCLHGTTQGCQA 
S SDSLAFACTGQPRV AR L 

Q QRY L S I PA AL S K R H A A P 
" N S D . T C A S P L P W H S E T L . L R 
T ATQVLQHSRGTVKPSCG 

ACA ACG ACA GAC ATG TTC GAC TAC CCT CGC CGG TCA CTG AAA GCC ACT CGT CGG 
59679 59688 59697 59706 59715 59724 

TGT TGC TGT CTG TAC AAG CTG ATG GGA GCG GCC AGT GAC TTT CGG TGA GCA GCC 

CCCLYKLMGAASDFR*AA 
V A V C'T S * W E R P V T F .G E Q P 
LLSVQAD GSGQ*LSVSSR 

TGARRPHDGCS SR*RNVA 
HV QADRT lEALLDDVT *Q 
TYRRTAP SR RLF I TL P E S 



CCA CAT GGA CGC GCA GCG CCC ACT AGA GGC GTT CTT CTA GCA GTT GCC AAG TGA 
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GGT GTA CCT GCG CGT CGC GGG TGA TCT CCG CAA GAA GAT CGT CAA CGG TTC ACT 




CGG TGG CGT GTG GGC GGA GGG CAG GGT CCG GTC CTA GG 5' 

59787 59796 59805 59814 

GCC ACC GCA CAC CCG CCT CCC GTC CCA GGC CAG GAT CC 3' 



AT.AHPPPVPGQD 
PPHTRLPSQA RI 
HRTPASRPRPGS 
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